目标分割学习之U_net

仙女修炼史2025-12-02 17:13

U_net是专门为生物医学图像而设计的分割网络。

U_net网络结构

上图是U_net的网络结构，

1）、输入图片1x572x572，经过两次3x3卷积后，变为64x568x568，

2）、2x2的max pool 下采样，变为64x284x284，经过两个卷积，变为128x280x280，

3）、下采样后，128x140x140后，变为128x140x140，经过两个卷积，变为，256x136x136;

4）、下采样后，256x68x68，经过两次卷积后，变为512x64x64;

5）、下采样后，512x32x32，经过两次卷积后，变为1024x28x28;

后面就是需要逐步进行上采样，每次上采样后，左边对应的特征层，会crop出来，然后和当前的特征进行通道上的扩充

U-Net是语义分割，一般语义分割，输出都是像素级别的，U-Net的输出是388x388x2，2是类别数，也就是，每个像素，都会输出，是类别1的概率，还是类别2的概率。

下图是U-Net的损失函数
在 388x388x2 输出的特征层上， ak(x)是，k特征通道，指的也是类别k，在像素位置x(二维空间）上，的数值，在某个像素位置上进行交叉熵计算，就是下面的公式。

上面公式w(x)是这个像素位置的权重，计算公式入下图：

d1是到最近的细胞边界的距离，d2是到第二近的细胞边界的距离

U-Net 的结构本身就在为医学图像服务

1、编码--解码对称结构 → 细粒度定位能力强

下采样捕捉语义

上采样恢复空间细节

适合分割精细器官和病灶

2、跳跃连接（Skip Connections） → 边界清晰

将编码阶段的高分辨率特征直接传给解码器