[论文阅读] Revisiting Feature Propagation and Aggregation in Polyp Segmentation

[论文地址] [代码] [MICCAI 23]


Abstract

息肉的准确分割是筛查过程中有效诊断结直肠癌的关键步骤。 由于能够有效捕获多尺度上下文信息,普遍采用类似UNet 的编码器-解码器框架。 然而,两个主要限制阻碍了网络实现有效的特征传播和聚合。 首先,跳跃连接仅将单个尺度特征传输到解码器,这可能导致特征表示有限。 其次,特征在没有任何信息过滤器的情况下被传输,这对于在解码器处执行特征融合来说效率低下。 为了解决这些限制,我们提出了一种新颖的特征增强网络,它利用特征传播增强和特征聚合增强模块来实现更有效的特征融合和多尺度特征传播。 具体来说,特征传播增强模块将所有编码器提取的特征图从编码器传输到解码器,而特征聚合增强模块则与门机制进行特征融合,从而实现更有效的信息过滤。 多尺度特征聚合模块为解码器提供丰富的多尺度语义信息,进一步增强网络的性能。 对五个数据集的广泛评估证明了我们方法的有效性,特别是在 CVC-ColonDB 和 ETIS 等具有挑战性的数据集上,在 mIoU,mDice方面,它可以显着优于(3%)之前最先进的模型。


Introduction

现有息肉分割网络特征传播与聚合的效果还不够好。具体针对Skip Conntection操作而言:

  • Skip Conntection(通常)只在同一个尺度进行,例如,直接将Encoder Block3的特征传到Decoder Block3,没有进行多尺度处理
  • Skip Conntection没有进行过滤(Attention操作),可能会带来噪声

针对以上两个问题,本文在U-Net的框架上进行了改进,对Skip Conntection过程进行了优化,如下所示:

具体来说,引入了一个FPE(Feature Propagation Enhancement)模块,其在Skip Conntection过程引入了多尺度的信息(Aggregation)以及特征增强(Enhancement)。此外,U-Net原有的解码器块也替换成了本文所提出的FAE(Feature Aggregation Enhancement)模块。


Network

FPE & FAE & MSA
相关推荐
m0_6501082413 小时前
MindDrive:融合世界模型与视觉语言模型的端到端自动驾驶框架
论文阅读·自动驾驶·轨迹生成与规划·世界动作模型·e2e-ad·vlm导向评估器·minddrive
CoookeCola13 小时前
无需抠图!Qwen-Image-Layered 一键分解图像图层,支持图层级精准编辑
论文阅读·深度学习·计算机视觉·ai作画·开源·视觉检测·aigc
bylander14 小时前
【论文阅读】VTP:Towards Scalable Pre-training of Visual Tokenizers for Generation
论文阅读·图像处理·大模型
czijin14 小时前
【论文阅读】LoRA: Low-Rank Adaptation of Large Language Models
论文阅读·人工智能·语言模型
有Li15 小时前
诊断文本引导的分层分类全玻片图像表征学习|文献速递-医疗影像分割与目标检测最新技术
论文阅读·深度学习·文献·医学生
万里鹏程转瞬至1 天前
论文简读:Qwen2.5-VL Technical Report
论文阅读·深度学习·多模态
万里鹏程转瞬至1 天前
论文简读:Qwen3-VL Technical Report | Qwen3VL技术报告
论文阅读·深度学习·多模态
墨绿色的摆渡人2 天前
论文笔记(一百一十二)Pos3R: 6D Pose Estimation for Unseen Objects Made Easy
论文阅读
c0d1ng2 天前
十二月第三周周报(论文阅读)
论文阅读
Xy-unu2 天前
[LLM]AIM: Adaptive Inference of Multi-Modal LLMs via Token Merging and Pruning
论文阅读·人工智能·算法·机器学习·transformer·论文笔记·剪枝