开源 医学对比感知注意力机制用于医学跨模态分割

复制代码
CHAM-Net 是一种对比优先的分割框架,它将一个基于临床原理的原则付诸实践:

对比度必须结合上下文来解读。临床医生从不孤立地判断一个像素,而是将其与其解剖结构周围的区域进行比较。

CHAM-Net 将此工作流程形式化为一个可执行的决策规则,该规则确定聚合在何处安全以及在何处必须保持分辨率,然后将该规则实例化到混合注意力架构中,用于跨模态的医学图像分割。

决策规则的 3 步:

  • 解剖 ROI 约束:先用器官/结构先验把分析限制在 ROI(例如 OCT 的 retinal band),避免玻璃体/脉络膜等区域干扰。

  • 动态对比度评估:在多个邻域尺度上计算"上下文参照"的对比度 proxy(特征 − 多尺度背景)。

  • 证据驱动决策低对比度 + 高均匀性 → mergeable(可压缩/可聚合);高对比度或异质 → non-mergeable(应保留)。


    实现:

  • ASPP 多分支 里做分支内的对比度裁决:在拼接前就用对比度 gate 决定各尺度分支的"强度/方向",避免"拼完再统一加权"的一刀切。

  • decoder 里复用同一 gate,并配合 解剖先验的选择性 skip:抑制均匀背景,专门保护薄层结构与病灶边界。

  • token-level merging 只在 ROI 内执行,ROI 外作为负对照区域,增强方法学可解释性与诊断一致性。


解释性证据

  • 提供 contrast token mergeability 的可视化,直观看到哪些 token 被判定可合并、哪些被强制保留。

  • 跨模态证据:对比度 proxy 的高响应会与膜状结构、血管壁、放射状边界等"解剖尖锐/细薄结构"共定位;低响应区域则被降权/合并。

  • 进一步用 POS(Planar Occlusion Sensitivity)RCP(Radial Context Profile) 证明模型确实使用了"整平面/远距离"上下文:遮挡 ROI 外区域也会显著影响 ROI 内预测,且随遮挡半径呈现非零甚至峰值响应。


RETOUCH OCT :mean Dice 95.54% ,相对 ConDSeg(2025)提升 +5.71 ,并在 PED 上提升 +13.90

  • COVID-19 CT :lesion Dice +5.04

  • CAS2023 MRA :vessel Dice +3.84

  • 参数规模约 23.95M,强调在"紧凑模型"下获得一致增益。

论文(ScienceDirect): https://www.sciencedirect.com/science/article/abs/pii/S0020025525011375

代码(GitHub): https://github.com/mh-zhou/CHAMNet

Thank you for your attention and reference, if you have any other questions, please contact us email: zhoumiehua25@mails.ucas.ac.cn . If you use this codebase in your work, please cite:

复制代码
@article{ZHOU2026123000,
title = {Contrast-Aware hybrid attention network for medical image segmentation},
journal = {Information Sciences},
volume = {734},
pages = {123000},
year = {2026},
issn = {0020-0255},
doi = {https://doi.org/10.1016/j.ins.2025.123000},
url = {https://www.sciencedirect.com/science/article/pii/S0020025525011375},
author = {Meihua Zhou and Jun Feng and Tianlong Zheng and Min Cheng and Li Yang}
}
相关推荐
砚边数影8 小时前
AI数学基础(一):线性代数核心,向量/矩阵运算的Java实现
java·数据库·人工智能·线性代数·矩阵·ai编程·金仓数据库
互联网科技看点8 小时前
诸葛io获认可:金融分析智能体赛道领航者
大数据·人工智能·金融
engchina8 小时前
自然语言转 SQL 并不是“魔法”
数据库·人工智能·sql·text2sql·nl2sql·自然语言转sql
一行注释也不写8 小时前
【卷积层和池化层在CNN中的作用】
深度学习·计算机视觉·cnn
少林码僧9 小时前
2.30 传统行业预测神器:为什么GBDT系列算法在企业中最受欢迎
开发语言·人工智能·算法·机器学习·ai·数据分析
Darkbluelr9 小时前
[开源发布] Dev-PlayBooks:让 AI 编程不再“抽卡”,面向 Claude/Codex等 的确定性Spec+TDD开发工作流框架
人工智能·软件工程·ai编程
2301_800256119 小时前
全球气候与环境变化考试知识点梳理(1)
大数据·人工智能
edisao9 小时前
六、 读者高频疑问解答 & 架构价值延伸
大数据·开发语言·人工智能·科技·架构·php
2501_936146049 小时前
目标检测论文解读复现之六基于RetinaNet的考拉检测方法
人工智能·目标检测·计算机视觉
zm-v-159304339869 小时前
最新AI-Python自然科学领域机器学习与深度学习技术
人工智能·python·机器学习