目标分割学习之U_net

U_net是专门为生物医学图像而设计的分割网络。

U_net网络结构

上图是U_net的网络结构,

1)、输入图片1x572x572,经过两次3x3卷积后,变为64x568x568,

2)、2x2的max pool 下采样,变为64x284x284,经过两个卷积,变为128x280x280,

3)、下采样后,128x140x140后,变为128x140x140,经过两个卷积,变为,256x136x136;

4)、下采样后,256x68x68,经过两次卷积后,变为512x64x64;

5)、下采样后,512x32x32,经过两次卷积后,变为1024x28x28;

后面就是需要逐步进行上采样,每次上采样后,左边对应的特征层,会crop出来,然后和当前的特征进行通道上的扩充

U-Net 损失函数

U-Net是语义分割,一般语义分割,输出都是像素级别的,U-Net的输出是388x388x2,2是类别数,也就是,每个像素,都会输出,是类别1的概率,还是类别2的概率。

下图是U-Net的损失函数
在 388x388x2 输出的特征层上, ak(x)是,k特征通道,指的也是类别k,在像素位置x(二维空间)上,的数值,在某个像素位置上进行交叉熵计算,就是下面的公式。

上面公式w(x)是这个像素位置的权重,计算公式入下图:

d1是到最近的细胞边界的距离,d2是到第二近的细胞边界的距离

为什么 U-Net 适合?

U-Net 的结构本身就在为医学图像服务

1、编码--解码对称结构 → 细粒度定位能力强

下采样捕捉语义

上采样恢复空间细节

适合分割精细器官和病灶

2、跳跃连接(Skip Connections) → 边界清晰

将编码阶段的高分辨率特征直接传给解码器

相关推荐
湘美书院--湘美谈教育12 小时前
湘美谈教育湘美书院网文研究:人工智能与微型小说选集
人工智能·深度学习·神经网络·机器学习·ai写作
uzong13 小时前
Harness Engineering 是什么?一场新的 AI 范式已经开始
人工智能·后端·架构
墨有66613 小时前
FieldFormer:基于物理场论的极简AI大模型底层架构,附带源码
人工智能·架构·电磁场算法映射
Mountain and sea13 小时前
从零搭建工业机器人激光切割+焊接产线:KUKA七轴协同+节卡AGV+视觉检测实战复盘
人工智能·机器人·视觉检测
K姐研究社13 小时前
阿里JVS Claw实测 – 手机一键部署 OpenClaw,开箱即用
人工智能·智能手机·aigc·飞书
卷积殉铁子13 小时前
从“手动挡”到“自动驾驶”:OpenClaw如何让AI开发变成“说话就行”
人工智能
机器之心13 小时前
扎克伯格正在打造自己的「AI分身」,并计划裁掉1.6万人
人工智能·openai
梦醒过后说珍重13 小时前
炼丹笔记:感知超分辨率模型中复合损失权重的科学调参SOP
深度学习
机器之心13 小时前
必看!Sebastian Raschka新博客盘点了所有主要注意力机制
人工智能·openai
CoovallyAIHub14 小时前
Pipecat:构建实时语音 AI Agent 的开源编排框架,500ms 级端到端延迟
深度学习·算法·计算机视觉