AI在医学领域:MIL回归用于前列腺癌复发预测

2024年,全球男性新癌症病例预计为1029080例,其中前列腺癌病例预计为29%。前列腺癌是男性中第二常见的癌症类型,仅次于肺癌。它主要影响老年男性,且发病率随年龄增长而增加。前列腺癌的主要治疗方法是前列腺切除术,但术后复发率较高(高达 40%)。++++格里森评分(Gleason score)是当前用于评估前列腺癌风险等级的主要方法,它基于组织形态学特征进行分级++++。尽管格里森评分在临床上广泛应用,但它存在局限性,同一格里森评分等级内的复发率存在差异。近年来,深度学习方法开始被用于分析组织微阵列的数字化组织学图像,以预测生化复发。这些方法相较于传统的格里森评分,显示出了更高的预测准确性。

++++本文提出了一种两阶段的 MIL 回归方法来预测前列腺癌的生物化学复发时间(TTR)。该方法采用"快速思考 & 慢速思考"策略,旨在提高斑块采样/池化和推理效率。++++

++++源代码网址:https://github.com/++**++** ++++yousuhang/IU-ComPath-LeoPard++++

1 方法

本文提出了一种基于多实例学习的两阶段方法,用于预测前列腺癌患者的生化复发时间 (TTR)。该方法遵循"快思考 & 慢思考"的策略,以提高预测效率和准确率。

1.1 快速定位 (Thinking Fast)

  • 目标: 快速找到与生化复发最相关的 WSI 区域。
  • 分辨率: 使用低分辨率 (≈ 16mpp) 的 WSI 进行预测,以减少推理时间。
  • 模型: 使用 CLAM-SB 模型进行分类,判断每个 WSI 是否会在特定时间阈值 T 内复发。
  • 结果: 生成每个区域的注意力图,并选择注意力得分最高的前 m% (最多 40%) 区域。
  • 作用: 过滤掉不相关的组织,为第二阶段的预测提供更精准的区域。

1.2 精细预测 (Thinking Slow)

  • 目标: 利用高分辨率 (≈ 0.25mpp) 的 WSI 预测患者的 TTR。
  • 模型:从第一阶段选定的区域中提取 2048x2048 的 patches,并进行特征提取。使用 Cox Proportional Hazards (CPH) 模型进行回归,预测患者的复发风险 R。使用 top-k 和注意力池化选择最重要的特征进行预测。
  • 结果: 得到每个患者的 TTR 预测值。
  • 作用: 在更相关的区域内进行精细预测,提高预测准确率。

1.3 模型训练和评估

  • 使用 Adam 优化器进行训练。
  • 使用 AUC 和 C-index 作为评估指标。
  • 使用交叉验证选择最佳模型参数。

1.4 可解释性

  • 第一阶段生成注意力图,可视化最相关的区域。
  • 第二阶段使用注意力机制,突出显示对 TTR 预测最重要的区域。

2 结果

2.1 模型性能

  • 内部验证集: 在内部验证集上,该方法取得了 0.733 的平均 C-index (σ = 0.059),优于其他方法(MAD-MIL: 0.704 ± 0.058,AC-MIL: 0.714 ± 0.056)。
  • LEOPARD 挑战验证集: 在 LEOPARD 挑战验证集上,该方法取得了 0.603 的 C-index (CiRadboud = 0.616, Ciexternal = 0.589),表现良好。

2.2 消融实验结果

  • (A) 和 (C) 展示了在不同WSI百分比(m)下,不同top_k设置的比较。
  • (B) 和 (D) 比较了MAD-MIL、AC-MIL和我们提出的MIL方法在不同m参数下的最佳参数设置。
  • (A) 和 (B) 中的y轴代表在外保留集上评估的平均Ci值,而(C) 和 (D) 中的y轴代表Ci的标准差(σCi)。
  • x轴代表用于"慢速思考"阶段的图像块百分比。

2.2.1 结论

  • topk 和 m 的选择: 通过消融实验,发现当 topk = 30 且 m = 10% 时,模型性能最佳。这表明并非 WSI 的所有区域都对 TTR 预测同等重要,关注更相关的区域可以提高预测效率和准确率。
  • 与 MAD-MIL 和 AC-MIL 的比较: 在几乎所有的 m 参数设置下,该方法在 TTR 预测方面都优于 MAD-MIL 和 AC-MIL。

2.3 可解释性

2.3.1 注意力热图

  • 通过在组织图像上叠加注意力热图,可以直观地展示模型在进行预测时关注图像的哪些部分。
  • 热图中较暖的颜色(如红色)表示模型在做出分类或回归决策时认为更重要的区域。

2.3.2 图像展示

  • 图形中的左侧图像显示了整个WSI区域的注意力热图,而右侧图像则放大显示了左侧图像中选定的特定区域。
  • 这种放大视图有助于更细致地观察和分析模型在预测过程中特别关注的区域。

2.3.3 结论

  • 注意力机制: 该方法利用注意力机制来可视化模型的注意力区域,从而提高可解释性。
  • 注意力区域: 结果表明,注意力区域主要集中在肿瘤组织区域,这与临床知识相符。

2.4 局限性

该方法使用 CPH 模型进行风险预测,而非直接预测 TTR。未来可以考虑使用更直接的 TTR 预测模型。

2.5 未来方向

  • 其他肿瘤类型: 将该方法扩展到其他肿瘤类型的 TTR 预测。
  • 直接 TTR 预测: 使用更直接的 TTR 预测模型,例如生存分析模型。
相关推荐
volcanical44 分钟前
Dataset Distillation with Attention Labels for Fine-tuning BERT
人工智能·深度学习·bert
L_cl1 小时前
【NLP 17、NLP的基础——分词】
人工智能·自然语言处理
西西弗Sisyphus1 小时前
大型语言模型(LLMs)演化树 Large Language Models
人工智能·语言模型·自然语言处理·大模型
车载诊断技术3 小时前
电子电气架构 --- 什么是EPS?
网络·人工智能·安全·架构·汽车·需求分析
KevinRay_3 小时前
Python超能力:高级技巧让你的代码飞起来
网络·人工智能·python·lambda表达式·列表推导式·python高级技巧
跃跃欲试-迪之3 小时前
animatediff 模型网盘分享
人工智能·stable diffusion
Captain823Jack3 小时前
nlp新词发现——浅析 TF·IDF
人工智能·python·深度学习·神经网络·算法·自然语言处理
被制作时长两年半的个人练习生3 小时前
【AscendC】ReduceSum中指定workLocal大小时如何计算
人工智能·算子开发·ascendc
Captain823Jack4 小时前
w04_nlp大模型训练·中文分词
人工智能·python·深度学习·神经网络·算法·自然语言处理·中文分词
Black_mario4 小时前
链原生 Web3 AI 网络 Chainbase 推出 AVS 主网, 拓展 EigenLayer AVS 应用场景
网络·人工智能·web3