目标分割学习之U_net

U_net是专门为生物医学图像而设计的分割网络。

U_net网络结构

上图是U_net的网络结构,

1)、输入图片1x572x572,经过两次3x3卷积后,变为64x568x568,

2)、2x2的max pool 下采样,变为64x284x284,经过两个卷积,变为128x280x280,

3)、下采样后,128x140x140后,变为128x140x140,经过两个卷积,变为,256x136x136;

4)、下采样后,256x68x68,经过两次卷积后,变为512x64x64;

5)、下采样后,512x32x32,经过两次卷积后,变为1024x28x28;

后面就是需要逐步进行上采样,每次上采样后,左边对应的特征层,会crop出来,然后和当前的特征进行通道上的扩充

U-Net 损失函数

U-Net是语义分割,一般语义分割,输出都是像素级别的,U-Net的输出是388x388x2,2是类别数,也就是,每个像素,都会输出,是类别1的概率,还是类别2的概率。

下图是U-Net的损失函数
在 388x388x2 输出的特征层上, ak(x)是,k特征通道,指的也是类别k,在像素位置x(二维空间)上,的数值,在某个像素位置上进行交叉熵计算,就是下面的公式。

上面公式w(x)是这个像素位置的权重,计算公式入下图:

d1是到最近的细胞边界的距离,d2是到第二近的细胞边界的距离

为什么 U-Net 适合?

U-Net 的结构本身就在为医学图像服务

1、编码--解码对称结构 → 细粒度定位能力强

下采样捕捉语义

上采样恢复空间细节

适合分割精细器官和病灶

2、跳跃连接(Skip Connections) → 边界清晰

将编码阶段的高分辨率特征直接传给解码器

相关推荐
三不原则几秒前
实战:Serverless 架构部署高频 AI API,动态扩缩容配置
人工智能·架构·serverless
华如锦2 分钟前
MongoDB作为小型 AI智能化系统的数据库
java·前端·人工智能·算法
lkbhua莱克瓦242 分钟前
Prompt、分词器与Token介绍
人工智能·ai·prompt·token
机器学习之心HML2 分钟前
GSABO(通常指混合了模拟退火SA和天牛须搜索BAS的改进算法)与BP神经网络结合,用于爆破参数优选
人工智能·神经网络·算法·爆破参数优选
雨大王5123 分钟前
汽车企业如何选择适合的质量数字化运营平台解决方案?
人工智能·汽车·制造
:mnong4 分钟前
深度学习框架TensorFlow与PyTorch的对比
pytorch·深度学习·tensorflow
QiZhang | UESTC4 分钟前
深度解析:反向传播在神经网络训练中的应用(豆包写的)
人工智能·深度学习·神经网络
EricLee4 分钟前
2025 年终总结 - Agent 元年
前端·人工智能·后端
0x00077 分钟前
Anthropic 发布 Cowork :Claude 跳出控制台!
人工智能
week_泽1 小时前
第4课:为什么记忆能力如此重要 - 学习笔记_4
人工智能·笔记·学习·ai agent