【论文阅读笔记】Sam3d: Segment anything model in volumetric medical images[

Bui N T, Hoang D H, Tran M T, et al. Sam3d: Segment anything model in volumetric medical images[J]. arXiv preprint arXiv:2309.03493, 2023.【开源】

本文提出的SAM3D模型是针对三维体积医学图像分割的一种新方法。其核心在于将"分割任何事物"(SAM)模型的预训练编码器与一个轻量级的3D解码器相结合。与传统的逐层处理不同,SAM3D能够在整个体积上处理图像,更有效地捕捉切片间的深度关系,同时维持模型的简单性和计算效率。

主要特点包括:

  1. 预训练的SAM编码器:该编码器在大规模数据集上预训练,能够提取出鲁棒的低级特征,如边缘和边界,这些在不同的图像域中都有相关性。

  2. 去除了SAM中的prompts Encoder:因为解码器必须处理 3D 体积数据,所以不能使用 SAM 的掩模解码器,它是专门为 2D 自然图像设计的

  3. 轻量级3D解码器:为了处理3D体积数据,SAM3D提出了一个适当的3D解码器。这个解码器由四个3D卷积块和一个分割头组成,通过跳跃连接实现,有助于在保持模型简单的同时提高分割性能。

  4. 处理方式:SAM3D通过先将3D体积图像分解为2D切片,然后通过预训练的SAM编码器处理每个切片,生成3D切片嵌入。这些嵌入被3D解码器进一步处理,以捕获切片间的深度关系。

  5. 损失函数:模型训练使用了组合损失函数,包括dice loss和cross-entropy loss,以优化分割性能。

  6. 实验结果:通过在多个医学图像数据集上的实验,只需要单2080TI GPU,SAM3D显示了与当前最先进的3D神经网络和基于Transformer的模型相当的性能(其实弱很多),同时在参数数量上大大减少。

相关推荐
TANGLONG2222 小时前
【C++】继承详解——基类/派生类、作用域、默认函数、菱形继承(超详细)
java·c语言·c++·经验分享·笔记·ajax
木木_王3 小时前
嵌入式学习 | STM32裸板驱动开发(Day01)入门学习笔记(超详细完整版|点灯实验 + 库函数代码 + 原理全解)
linux·驱动开发·笔记·stm32·学习
largecode3 小时前
能不能让座机号码显示“XX公司”那样的认证名称?申请号码认证方法
经验分享·笔记·音视频·课程设计·oneapi·segmentfault·微信开放平台
Hua-Jay3 小时前
OpenCV联合C++/Qt 学习笔记(十七)----凸包检测、直线检测及点集拟合
c++·笔记·qt·opencv·学习·计算机视觉
是喵斯特ya4 小时前
红日内网靶场1环境搭建
笔记
中屹指纹浏览器4 小时前
2026浏览器插件扩展安全风险溯源与环境隔离防护规范
经验分享·笔记
宵时待雨5 小时前
回溯算法专题1:递归
数据结构·c++·笔记·算法·leetcode·深度优先
今儿敲了吗5 小时前
面向对象(三)——设计模式
笔记·设计模式
是喵斯特ya5 小时前
红日内网靶场1渗透笔记
笔记·安全
一只机电自动化菜鸟5 小时前
一建机电备考笔记(34)焊接技术(设备与材料1)(含考频+题型)
笔记·学习·职场和发展·生活·学习方法