目标分割学习之U_net

U_net是专门为生物医学图像而设计的分割网络。

U_net网络结构

上图是U_net的网络结构,

1)、输入图片1x572x572,经过两次3x3卷积后,变为64x568x568,

2)、2x2的max pool 下采样,变为64x284x284,经过两个卷积,变为128x280x280,

3)、下采样后,128x140x140后,变为128x140x140,经过两个卷积,变为,256x136x136;

4)、下采样后,256x68x68,经过两次卷积后,变为512x64x64;

5)、下采样后,512x32x32,经过两次卷积后,变为1024x28x28;

后面就是需要逐步进行上采样,每次上采样后,左边对应的特征层,会crop出来,然后和当前的特征进行通道上的扩充

U-Net 损失函数

U-Net是语义分割,一般语义分割,输出都是像素级别的,U-Net的输出是388x388x2,2是类别数,也就是,每个像素,都会输出,是类别1的概率,还是类别2的概率。

下图是U-Net的损失函数
在 388x388x2 输出的特征层上, ak(x)是,k特征通道,指的也是类别k,在像素位置x(二维空间)上,的数值,在某个像素位置上进行交叉熵计算,就是下面的公式。

上面公式w(x)是这个像素位置的权重,计算公式入下图:

d1是到最近的细胞边界的距离,d2是到第二近的细胞边界的距离

为什么 U-Net 适合?

U-Net 的结构本身就在为医学图像服务

1、编码--解码对称结构 → 细粒度定位能力强

下采样捕捉语义

上采样恢复空间细节

适合分割精细器官和病灶

2、跳跃连接(Skip Connections) → 边界清晰

将编码阶段的高分辨率特征直接传给解码器

相关推荐
Mintopia14 小时前
OpenClaw 对软件行业产生的影响
人工智能
陈广亮14 小时前
构建具有长期记忆的 AI Agent:从设计模式到生产实践
人工智能
会写代码的柯基犬14 小时前
DeepSeek vs Kimi vs Qwen —— AI 生成俄罗斯方块代码效果横评
人工智能·llm
Mintopia15 小时前
OpenClaw 是什么?为什么节后热度如此之高?
人工智能
爱可生开源社区15 小时前
DBA 的未来?八位行业先锋的年度圆桌讨论
人工智能·dba
叁两18 小时前
用opencode打造全自动公众号写作流水线,AI 代笔太香了!
前端·人工智能·agent
前端付豪18 小时前
LangChain记忆:通过Memory记住上次的对话细节
人工智能·python·langchain
strayCat2325518 小时前
Clawdbot 源码解读 7: 扩展机制
人工智能·开源
程序员打怪兽18 小时前
详解Visual Transformer (ViT)网络模型
深度学习