目标分割学习之U_net

U_net是专门为生物医学图像而设计的分割网络。

U_net网络结构

上图是U_net的网络结构,

1)、输入图片1x572x572,经过两次3x3卷积后,变为64x568x568,

2)、2x2的max pool 下采样,变为64x284x284,经过两个卷积,变为128x280x280,

3)、下采样后,128x140x140后,变为128x140x140,经过两个卷积,变为,256x136x136;

4)、下采样后,256x68x68,经过两次卷积后,变为512x64x64;

5)、下采样后,512x32x32,经过两次卷积后,变为1024x28x28;

后面就是需要逐步进行上采样,每次上采样后,左边对应的特征层,会crop出来,然后和当前的特征进行通道上的扩充

U-Net 损失函数

U-Net是语义分割,一般语义分割,输出都是像素级别的,U-Net的输出是388x388x2,2是类别数,也就是,每个像素,都会输出,是类别1的概率,还是类别2的概率。

下图是U-Net的损失函数
在 388x388x2 输出的特征层上, ak(x)是,k特征通道,指的也是类别k,在像素位置x(二维空间)上,的数值,在某个像素位置上进行交叉熵计算,就是下面的公式。

上面公式w(x)是这个像素位置的权重,计算公式入下图:

d1是到最近的细胞边界的距离,d2是到第二近的细胞边界的距离

为什么 U-Net 适合?

U-Net 的结构本身就在为医学图像服务

1、编码--解码对称结构 → 细粒度定位能力强

下采样捕捉语义

上采样恢复空间细节

适合分割精细器官和病灶

2、跳跃连接(Skip Connections) → 边界清晰

将编码阶段的高分辨率特征直接传给解码器

相关推荐
旖旎夜光11 小时前
C++(17)
c++·学习
上进小菜猪11 小时前
基于 YOLOv8 的智能车牌定位检测系统设计与实现—从模型训练到 PyQt 可视化落地的完整实战方案
人工智能
AI浩11 小时前
UNIV:红外与可见光模态的统一基础模型
人工智能·深度学习
GitCode官方11 小时前
SGLang AI 金融 π 对(杭州站)回顾:大模型推理的工程实践全景
人工智能·金融·sglang
专注于大数据技术栈12 小时前
java学习--StringBuilder
java·学习
木头左12 小时前
LSTM模型入参有效性验证基于量化交易策略回测的方法学实践
人工智能·rnn·lstm
找方案12 小时前
我的 all-in-rag 学习笔记:文本分块 ——RAG 系统的 “信息切菜术“
人工智能·笔记·all-in-rag
亚马逊云开发者12 小时前
让 AI 工作空间更智能:Amazon Quick Suite 集成博查搜索实践
人工智能
腾讯WeTest12 小时前
「低成本、高质高效」WeTest AI翻译限时免费
人工智能
Lucas5555555512 小时前
现代C++四十不惑:AI时代系统软件的基石与新征程
开发语言·c++·人工智能