ICCV MK-UNet:多核深度可分离卷积医学分割

ICCV MK-UNet:多核深度可分离卷积医学分割

一篇ICCV 2025 的 Paper《MK-UNet》,MK-UNet 证明了:不用 Transformer,纯 CNN 只要设计得好,照样能 SOTA,而且参数量小了 300 多倍!

论文原文 :https://arxiv.org/abs/2509.18493

代码:https://github.com/SLDGroup/MK-UNett

即插即用代码仓库:https://github.com/AITricks/AITricks

1️⃣ 痛点:轻量级模型"看不远"

以前为了轻量化,我们通常用 MobileNet 或者单纯减少通道数。虽然速度快了,但卷积核太小,感受野很窄,根本看不全病灶的整体形状。

MK-UNet 就是为了解决这个的难题。

2️⃣ 核心大招:多核深度卷积

作者的思路:既然 3x3 卷积看不远,大卷积核又太慢,那我并行用不就行了?

MK-UNet 不再纠结用多大的核,而是同时用 3x3、5x5、7x7... 等不同尺寸的深度卷积。

既能看到微小的细节,又能看到宏观的轮廓。

3️⃣ 架构设计:MKIR 模块

它把这个多核思想融入到了 倒残差块 里,提出了 MKIR。

这简直是 MobileNetV2 的究极进化版!在提取特征的时候,它能自动适应不同大小的目标。不管你的病灶是巨大的器官,还是微小的息肉,它都能匹配到最合适的卷积核去处理。

4️⃣ 提纯神器:分组注意力门

在 U-Net 的跳跃连接部分。其实带了很多噪声。MK-UNet 设计了个 GAG。

它把特征分组,每一组单独算注意力,把无关的背景噪声滤掉,只保留有用的病灶信息。

5️⃣ 实验结果:参数极其小,精度极其高

参数量对比:TransUNet 有 105M 参数,MK-UNet 只有 0.316M!体积缩小了 333 倍。

精度吊打:在 BUSI、ISIC、CVC-ClinicDB等 6 个数据集上,MK-UNet 的 Dice 分数竟然比 TransUNet 还要高!

实测速度:在同样的硬件上,它的 FLOPs 只有 0.3G,推理速度飞快,完全可以在手机或者嵌入式设备上跑实时分割。

MK-UNet结构设计了多尺度+注意力,如果你在做医学分割、缺陷检测,这篇论文的 MKDC 模块绝对是最好用的"积木"!

#计算机视觉 #深度学习 #科研 #提供思路和创新点 #深度学习与神经网络 #论文 #医学图像分割 #论文分享 #医学

相关推荐
LinXunFeng5 天前
Obsidian - 使用 Share Note 分享笔记并自部署
前端·笔记·github
SM177152118389 天前
NSK紧凑型FA系列丝杠技术详解
经验分享·规格说明书
闪闪发亮的小星星9 天前
高斯光以及高斯光公式解释
笔记
2601_961845159 天前
粉笔行测题库|系统班|刷题
网络·百度·微信·微信公众平台·facebook·新浪微博
cqbzcsq9 天前
CellFlow虚拟细胞论文阅读
论文阅读·人工智能·笔记·学习·生物信息
fofantasy9 天前
NSK SFT3210-2.5 滚珠丝杠技术详解
经验分享·规格说明书
BomanGe109 天前
NSK USS1205N1D0321 紧凑型精密滚珠丝杠技术详解
经验分享·规格说明书
阿米亚波9 天前
【Windows】QEMU 启动 openEuler aarch64/arm64 架构系统 + 离线软件源
linux·windows·经验分享·笔记·架构·arm
AIHR数智引擎9 天前
KPI物理失效:AI原生组织的效能重构与技能度量
人工智能·经验分享·职场和发展·重构·ai-native·aihr
自传.9 天前
尚硅谷 Vibe Coding|第三章(1) Claude Code深度使用与进阶技巧 学习笔记
笔记·学习·尚硅谷·vibecoding