论文学习22:UNETR: Transformers for 3D Medical Image Segmentation

代码来源

unetr

模块作用

具有收缩和扩展路径的全卷积神经网络 (FCNN) 在大多数医学图像分割应用中表现出色,但卷积层的局部性限制了其学习长距离空间依赖性的能力。受 Transformer 在自然语言处理 (NLP) 领域近期在长距离序列学习方面取得的成功的启发,本文引入了一种名为 UNEt Transformers (UNETR) 的全新架构,它利用 Transformer 作为编码器来学习输入体的序列表征,并有效捕捉全局多尺度信息。Transformer 编码器通过不同分辨率的跳跃连接直接连接到解码器,以计算最终的语义分割输出。

模块结构

  • Transformer编码器
    • 将3D图像转换为序列,学习长距离依赖和全局多尺度上下文,确保模型捕捉器官/肿瘤的变异形状和位置。
  • CNN解码器
    • 通过上采样和跳跃连接恢复空间分辨率,融合全局(编码器)和局部(低级特征)信息,生成精确分割图。

总结

本文提出了一种基于Transformer的新型架构,称为UNETR,用于对体积医学图像进行语义分割,并将该任务重新表述为一维序列到序列的预测问题。研究人员提出使用Transformer编码器来增强模型学习长距离依赖关系的能力,并有效地捕捉多尺度的全局上下文表征。研究人员验证了UNETR在CT和MRI模式下不同体积分割任务中的有效性。UNETR在BTCV排行榜的标准赛和自由赛中均取得了多器官分割领域的新最高水平,并在MSD数据集上优于脑肿瘤和脾脏分割的竞争方法。总而言之,UNETR展现出了有效学习医学图像中关键解剖关系的潜力,这个方法可以作为医学图像分析中基于Transformer的新型分割模型的基础。

相关推荐
xy_recording6 小时前
学习番外:Docker和K8S理解
学习·docker·kubernetes
鱼嘻7 小时前
西嘎嘎学习 - C++ 继承 - Day 10
开发语言·c++·学习·算法
Hello_Embed7 小时前
STM32HAL 快速入门(二十四):I2C 编程(一)—— 从 OLED 显示初识 I2C 协议
c语言·stm32·单片机·嵌入式硬件·学习
凯尔萨厮7 小时前
Java学习笔记四(继承)
java·笔记·学习
ホロHoro7 小时前
学习笔记:Javascript(5)——事件监听(用户交互)
javascript·笔记·学习
爱喝水的鱼丶8 小时前
SAP-MM:SAP核心组织单元:工厂(Plant)全面学习指南及配置图解
学习·sap·abap·配置·工厂·mm模块
励志不掉头发的内向程序员8 小时前
STL库——AVL树
开发语言·c++·学习
晨非辰10 小时前
#C语言——刷题攻略:牛客编程入门训练(十一):攻克 循环控制(三),轻松拿捏!
c语言·开发语言·经验分享·学习·visual studio
xiaoxiaoxiaolll11 小时前
期刊速递 | 《Light Sci. Appl.》超宽带光热电机理研究,推动碳纳米管传感器在制药质控中的实际应用
人工智能·学习
励志码农12 小时前
JavaWeb 30 天入门:第二十三天 —— 监听器(Listener)
java·开发语言·spring boot·学习·servlet