开源医学对比感知注意力机制用于医学跨模态分割

复制代码

CHAM-Net 是一种对比优先的分割框架，它将一个基于临床原理的原则付诸实践：

对比度必须结合上下文来解读。临床医生从不孤立地判断一个像素，而是将其与其解剖结构周围的区域进行比较。

CHAM-Net 将此工作流程形式化为一个可执行的决策规则，该规则确定聚合在何处安全以及在何处必须保持分辨率，然后将该规则实例化到混合注意力架构中，用于跨模态的医学图像分割。

决策规则的 3 步：

解剖 ROI 约束：先用器官/结构先验把分析限制在 ROI（例如 OCT 的 retinal band），避免玻璃体/脉络膜等区域干扰。
动态对比度评估：在多个邻域尺度上计算"上下文参照"的对比度 proxy（特征 − 多尺度背景）。
证据驱动决策 ：低对比度 + 高均匀性 → mergeable（可压缩/可聚合）；高对比度或异质 → non-mergeable（应保留）。

实现：
在 ASPP 多分支 里做分支内的对比度裁决：在拼接前就用对比度 gate 决定各尺度分支的"强度/方向"，避免"拼完再统一加权"的一刀切。
在 decoder 里复用同一 gate，并配合 解剖先验的选择性 skip：抑制均匀背景，专门保护薄层结构与病灶边界。
token-level merging 只在 ROI 内执行，ROI 外作为负对照区域，增强方法学可解释性与诊断一致性。

解释性证据

提供 contrast token mergeability 的可视化，直观看到哪些 token 被判定可合并、哪些被强制保留。
跨模态证据：对比度 proxy 的高响应会与膜状结构、血管壁、放射状边界等"解剖尖锐/细薄结构"共定位；低响应区域则被降权/合并。
进一步用 POS（Planar Occlusion Sensitivity） 与 RCP（Radial Context Profile） 证明模型确实使用了"整平面/远距离"上下文：遮挡 ROI 外区域也会显著影响 ROI 内预测，且随遮挡半径呈现非零甚至峰值响应。

RETOUCH OCT ：mean Dice 95.54% ，相对 ConDSeg（2025）提升 +5.71 ，并在 PED 上提升 +13.90。

COVID-19 CT ：lesion Dice +5.04。
CAS2023 MRA ：vessel Dice +3.84。
参数规模约 23.95M，强调在"紧凑模型"下获得一致增益。

论文（ScienceDirect）: https://www.sciencedirect.com/science/article/abs/pii/S0020025525011375

代码（GitHub）: https://github.com/mh-zhou/CHAMNet

Thank you for your attention and reference, if you have any other questions, please contact us email: zhoumiehua25@mails.ucas.ac.cn . If you use this codebase in your work, please cite:

复制代码

@article{ZHOU2026123000,
title = {Contrast-Aware hybrid attention network for medical image segmentation},
journal = {Information Sciences},
volume = {734},
pages = {123000},
year = {2026},
issn = {0020-0255},
doi = {https://doi.org/10.1016/j.ins.2025.123000},
url = {https://www.sciencedirect.com/science/article/pii/S0020025525011375},
author = {Meihua Zhou and Jun Feng and Tianlong Zheng and Min Cheng and Li Yang}
}

开源 医学对比感知注意力机制用于医学跨模态分割

开源医学对比感知注意力机制用于医学跨模态分割