目标分割学习之U_net

U_net是专门为生物医学图像而设计的分割网络。

U_net网络结构

上图是U_net的网络结构,

1)、输入图片1x572x572,经过两次3x3卷积后,变为64x568x568,

2)、2x2的max pool 下采样,变为64x284x284,经过两个卷积,变为128x280x280,

3)、下采样后,128x140x140后,变为128x140x140,经过两个卷积,变为,256x136x136;

4)、下采样后,256x68x68,经过两次卷积后,变为512x64x64;

5)、下采样后,512x32x32,经过两次卷积后,变为1024x28x28;

后面就是需要逐步进行上采样,每次上采样后,左边对应的特征层,会crop出来,然后和当前的特征进行通道上的扩充

U-Net 损失函数

U-Net是语义分割,一般语义分割,输出都是像素级别的,U-Net的输出是388x388x2,2是类别数,也就是,每个像素,都会输出,是类别1的概率,还是类别2的概率。

下图是U-Net的损失函数
在 388x388x2 输出的特征层上, ak(x)是,k特征通道,指的也是类别k,在像素位置x(二维空间)上,的数值,在某个像素位置上进行交叉熵计算,就是下面的公式。

上面公式w(x)是这个像素位置的权重,计算公式入下图:

d1是到最近的细胞边界的距离,d2是到第二近的细胞边界的距离

为什么 U-Net 适合?

U-Net 的结构本身就在为医学图像服务

1、编码--解码对称结构 → 细粒度定位能力强

下采样捕捉语义

上采样恢复空间细节

适合分割精细器官和病灶

2、跳跃连接(Skip Connections) → 边界清晰

将编码阶段的高分辨率特征直接传给解码器

相关推荐
科技小花1 天前
全球化深水区,数据治理成为企业出海 “核心竞争力”
大数据·数据库·人工智能·数据治理·数据中台·全球化
zhuiyisuifeng1 天前
2026前瞻:GPTimage2镜像官网或将颠覆视觉创作
人工智能·gpt
徐健峰1 天前
GPT-image-2 热门玩法实战(一):AI 看手相 — 一张手掌照片生成专业手相分析图
人工智能·gpt
weixin_370976351 天前
AI的终极赛跑:进入AGI,还是泡沫破灭?
大数据·人工智能·agi
Slow菜鸟1 天前
AI学习篇(五) | awesome-design-md 使用说明
人工智能·学习
冬奇Lab1 天前
RAG 系列(五):Embedding 模型——语义理解的核心
人工智能·llm·aigc
深小乐1 天前
AI 周刊【2026.04.27-05.03】:Anthropic 9000亿美元估值、英伟达死磕智能体、中央重磅定调AI
人工智能
码点滴1 天前
什么时候用 DeepSeek V4,而不是 GPT-5/Claude/Gemini?
人工智能·gpt·架构·大模型·deepseek
狐狐生风1 天前
LangChain 向量存储:Chroma、FAISS
人工智能·python·学习·langchain·faiss·agentai
波动几何1 天前
CDA架构代码工坊技能cda-code-lab
人工智能