ICCV MK-UNet:多核深度可分离卷积医学分割
一篇ICCV 2025 的 Paper《MK-UNet》,MK-UNet 证明了:不用 Transformer,纯 CNN 只要设计得好,照样能 SOTA,而且参数量小了 300 多倍!
论文原文 :https://arxiv.org/abs/2509.18493
代码:https://github.com/SLDGroup/MK-UNett
即插即用代码仓库:https://github.com/AITricks/AITricks
1️⃣ 痛点:轻量级模型"看不远"
以前为了轻量化,我们通常用 MobileNet 或者单纯减少通道数。虽然速度快了,但卷积核太小,感受野很窄,根本看不全病灶的整体形状。
MK-UNet 就是为了解决这个的难题。
2️⃣ 核心大招:多核深度卷积
作者的思路:既然 3x3 卷积看不远,大卷积核又太慢,那我并行用不就行了?
MK-UNet 不再纠结用多大的核,而是同时用 3x3、5x5、7x7... 等不同尺寸的深度卷积。
既能看到微小的细节,又能看到宏观的轮廓。
3️⃣ 架构设计:MKIR 模块
它把这个多核思想融入到了 倒残差块 里,提出了 MKIR。
这简直是 MobileNetV2 的究极进化版!在提取特征的时候,它能自动适应不同大小的目标。不管你的病灶是巨大的器官,还是微小的息肉,它都能匹配到最合适的卷积核去处理。
4️⃣ 提纯神器:分组注意力门
在 U-Net 的跳跃连接部分。其实带了很多噪声。MK-UNet 设计了个 GAG。
它把特征分组,每一组单独算注意力,把无关的背景噪声滤掉,只保留有用的病灶信息。
5️⃣ 实验结果:参数极其小,精度极其高
参数量对比:TransUNet 有 105M 参数,MK-UNet 只有 0.316M!体积缩小了 333 倍。
精度吊打:在 BUSI、ISIC、CVC-ClinicDB等 6 个数据集上,MK-UNet 的 Dice 分数竟然比 TransUNet 还要高!
实测速度:在同样的硬件上,它的 FLOPs 只有 0.3G,推理速度飞快,完全可以在手机或者嵌入式设备上跑实时分割。
MK-UNet结构设计了多尺度+注意力,如果你在做医学分割、缺陷检测,这篇论文的 MKDC 模块绝对是最好用的"积木"!
#计算机视觉 #深度学习 #科研 #提供思路和创新点 #深度学习与神经网络 #论文 #医学图像分割 #论文分享 #医学