[CVPR 2026]SPEGC: 基于语义提示与图聚类的医学图像连续测试期自适应

CVPR 2026 | 告别伪标签与熵最小化!SPEGC:基于语义提示与图聚类的医学图像连续测试期自适应

论文题目 :SPEGC: Continual Test-Time Adaptation via Semantic-Prompt-Enhanced Graph Clustering for Medical Image Segmentation
发表出处 :arXiv 2026
作者机构 :Xiaogang Du, Jiawei Zhang, Tongfei Liu, Tao Lei, Yingbo Wang (陕西科技大学,陕西省人工智能联合实验室)
关键词:Continual Test-Time Adaptation (CTTA), Medical image segmentation, Graph Clustering, Semantic Prompts


1. 🚀 省流版摘要 (TL;DR)

在真实的临床环境中,医学图像数据往往以连续数据流 的形式出现,且数据分布不断变化。现有的连续测试期自适应(CTTA)方法大多依赖于模型自身的预测置信度(如熵最小化)或伪标签,这在面对严重的领域偏移时极易引发"错误累积"和"灾难性遗忘"。为了打破这一困境,本文提出了一种全新的框架 SPEGC 。该方法放弃了不可靠的像素级监督,转而利用语义提示增强(SPFE)可微图聚类(DGCS),从数据内部提取高阶的结构信息来指导模型的自我调节。在眼底图像、息肉分割以及3D心脏MRI分割任务中,SPEGC 全面超越了现有的 SOTA 方法,展现出了极强的抗遗忘能力和泛化性!


2. 🧐 背景与痛点 (Motivation)

  • 现有问题:预训练的医学图像分割模型在遇到不同医院、不同设备的测试数据时,性能会大幅下降(Domain Shift)。
  • 传统 CTTA 方法的局限
    • 基于熵最小化/伪标签的方法(如 SAR, GraTa) :在目标域数据特征不明显时(例如息肉分割任务中,病灶隐蔽且形态各异),模型容易产生过度自信的错误预测。基于这些错误预测进行梯度更新,会导致严重的错误累积(Error Accumulation),甚至表现不如完全不适应的 Baseline(No Adapt)。
    • 基于输入层提示的方法(如 VPTTA):虽然冻结了骨干网络参数,缓解了遗忘问题,但仅在输入空间学习轻量级提示,面对严重的领域偏移时显得"心有余而力不足",无法有效捕捉深层的高阶语义结构。
  • 本文的切入点 :作者认为,与其相信模型在未知领域那"脆弱的置信度",不如相信数据本身内在的高阶聚类化结构(High-order structural abstractions)。如果能构建一个图结构,让具有相似语义的节点(像素/特征)在特征空间中聚拢,就能提供更稳定、更鲁棒的监督信号。

3. 💡 核心方法 (Methodology)

SPEGC 框架主要由两大核心模块组成:语义提示特征增强(SPFE)可微图聚类求解器(DGCS)

3.1 语义提示特征增强 (SPFE: Semantic Prompt Feature Enhancement)

在未知的目标域中,局部特征往往充满噪声。为了让特征更鲁棒,作者设计了一个双路提示池机制:

  • 不确定性采样:首先通过 MC Dropout 评估预测的不确定性,只挑选出最稳定、不确定性最低的节点来构建图。
  • 解耦的提示池
    • 共性提示池 (Commonality Prompt, (P_{CO})):利用反向注意力机制,提取跨领域的共享核心语义(跨域不变特征)。
    • 异质性提示池 (Heterogeneity Prompt, (P_{HE})):利用标准注意力机制,提取当前样本特有的、用于区分不同类别的领域特定特征。
  • 特征融合:将这两种全局上下文信息注入到局部的节点特征中,得到增强后的特征 (V_i^*),从而有效抵御领域偏移带来的噪声干扰。
3.2 可微图聚类求解器 (DGCS: Differentiable Graph Clustering Solver)

拿到增强的特征后,如何构建图并进行优化?

  • 痛点:传统的图分割(如生成最小生成树)是离散的、不可微的,无法用于深度学习的端到端反向传播。
  • 创新转化 :作者极其巧妙地将"图边缘稀疏化"问题重新表述为最优传输问题(Optimal Transport Problem)
  • Sinkhorn 算法求解 :通过引入熵正则化项,利用并行且完全可微的 Sinkhorn 算法,将原本充满噪声的全局相似度矩阵,提炼成一个能够反映真实语义聚类结构的"软"边缘相似度矩阵 (S^*)。
3.3 联合优化损失 (Loss Functions)
  • 图一致性损失 ((L_G)):利用 DGCS 提炼出的图结构 (S^*) 作为监督信号,强制要求结构上相似的两个节点,其语义预测也必须保持一致(通过 KL 散度约束)。
  • 聚类损失 ((L_C)):约束共性提示池,迫使模型在连续的测试数据流中记住核心的共享语义,有效防止灾难性遗忘。

4. 📊 实验与结果 (Experiments)

  • 数据集
    • OD/OC(视盘/视杯)分割:包含 5 个不同中心的眼底图像数据集。
    • 息肉分割:包含 4 个不同中心的肠镜数据集(难度极大,形态变异剧烈)。
    • M&MS 3D 心脏分割:包含 4 个不同厂商的 MRI 数据集。
  • 对比实验
    与 SAR, DomainAdaptor, NC-TTT, VPTTA, GraTa, TTDG 等 6 种前沿方法对比。
    • 惊艳的表现 :在 OD/OC 任务上,SPEGC 平均 Dice 达到 84.37% ;在极具挑战的息肉分割任务上,基于熵的方法(如 SAR)性能崩溃(68.84%,低于 No Adapt 的 71.49%),而 SPEGC 依然稳健,达到 78.00% 的 SOTA 表现。
  • 长程连续自适应 (L-CTTA)
    在连续 5 轮的循环测试中,SPEGC 展现了极强的抗遗忘能力,源域性能退化(Degradation)仅为 1.27%,而基于梯度对齐的 GraTa 退化了 3.52%。
  • 混合分布偏移 (Mixed Distribution Shifts)
    在将所有目标域数据随机打乱的极端流式场景下,SPEGC 依然保持了最高的平均 DSC,证明了其面对无序、剧烈分布变化的鲁棒性。

5. 🧠 笔者思考与总结 (Conclusion & Thoughts)

  • 优点总结
    这篇文章的数学品味非常高。它跳出了 CTTA 领域长期依赖的"伪标签"和"熵最小化"的窠臼,指出**"数据的内在结构比模型的盲目自信更可靠"**。将离散的图聚类转化为可微的最优传输问题(Sinkhorn),不仅在理论上十分优美,在实际的息肉分割这种困难任务上也展现出了降维打击般的稳定性。解耦的提示池设计也为缓解灾难性遗忘提供了很好的思路。
  • 潜在局限
    正如作者在结论中所坦诚的,显式的图构建和 Sinkhorn 求解带来了较高的计算复杂度。相比于仅更新 Prompt 的轻量级方法,SPEGC 构建 (V \times V) 的相似度矩阵在节点数较多时会显著增加显存占用(VRAM)和推理时间(FLOPs)。
  • 未来展望
    未来的工作可以考虑引入图稀疏化技术(Graph Sparsification)或更高效的线性复杂度 Transformer/Attention 机制来降低图构建的计算成本,使其在实时性要求极高的临床手术流(如内窥镜实时分割)中更具落地价值。
相关推荐
alfred_torres1 个月前
[npj Digital Med 2026] StructSAM:给SAM装上“解剖学导航”,肺结节分割SOTA新方案
医学图像分割
alfred_torres2 个月前
[TMI 2025] MedicoSAM:拒绝“灾难性遗忘”,医学图像分割基座模型的正确微调姿势
医学图像分割
_OP_CHEN3 个月前
【图像分割大模型】医学图像分割的大突破!Pact-Net 双分支网络碾压 SOTA,皮肤癌早筛精度飙升至 86.95%
人工智能·深度学习·计算机视觉·cnn·transformer·医学图像分割·人工智能论文
何如千泷5 个月前
【论文阅读】PathMR: Multimodal Visual Reasoning for Interpretable Pathology Analysis
论文阅读·医学图像分割·病理
烧技湾1 年前
SAM应用:医学图像和视频中的任何内容分割中的基准测试与部署
sam·医学图像分割·分割一切·med2san
罗小罗同学2 年前
人工智能在肿瘤亚型分类领域的研究进展|顶刊速递·24-08-13
人工智能·深度学习·分类·数据挖掘·医学图像分割·医学人工智能·肿瘤亚型分类
沃恩智慧2 年前
实现分割自动化!基于SAM的医学图像分割又双叒叕有新突破
人工智能·深度学习·自动化·sam·医学图像分割
罗小罗同学2 年前
MICS2024|少样本学习、多模态技术以及大语言模型在医学图像处理领域的研究进展|24-07-14
图像处理·学习·语言模型·医学图像分割·影像组学·病理组学·医学人工智能
@TangYi2 年前
MICCAI 2024Centerline Boundary Dice Loss for Vascular Segmentation
python·深度学习·计算机视觉·损失函数·医学图像分割·血管分割