AI在医学领域:MIL回归用于前列腺癌复发预测

2024年,全球男性新癌症病例预计为1029080例,其中前列腺癌病例预计为29%。前列腺癌是男性中第二常见的癌症类型,仅次于肺癌。它主要影响老年男性,且发病率随年龄增长而增加。前列腺癌的主要治疗方法是前列腺切除术,但术后复发率较高(高达 40%)。++++格里森评分(Gleason score)是当前用于评估前列腺癌风险等级的主要方法,它基于组织形态学特征进行分级++++。尽管格里森评分在临床上广泛应用,但它存在局限性,同一格里森评分等级内的复发率存在差异。近年来,深度学习方法开始被用于分析组织微阵列的数字化组织学图像,以预测生化复发。这些方法相较于传统的格里森评分,显示出了更高的预测准确性。

++++本文提出了一种两阶段的 MIL 回归方法来预测前列腺癌的生物化学复发时间(TTR)。该方法采用"快速思考 & 慢速思考"策略,旨在提高斑块采样/池化和推理效率。++++

++++源代码网址:https://github.com/++**++** ++++yousuhang/IU-ComPath-LeoPard++++

1 方法

本文提出了一种基于多实例学习的两阶段方法,用于预测前列腺癌患者的生化复发时间 (TTR)。该方法遵循"快思考 & 慢思考"的策略,以提高预测效率和准确率。

1.1 快速定位 (Thinking Fast)

  • 目标: 快速找到与生化复发最相关的 WSI 区域。
  • 分辨率: 使用低分辨率 (≈ 16mpp) 的 WSI 进行预测,以减少推理时间。
  • 模型: 使用 CLAM-SB 模型进行分类,判断每个 WSI 是否会在特定时间阈值 T 内复发。
  • 结果: 生成每个区域的注意力图,并选择注意力得分最高的前 m% (最多 40%) 区域。
  • 作用: 过滤掉不相关的组织,为第二阶段的预测提供更精准的区域。

1.2 精细预测 (Thinking Slow)

  • 目标: 利用高分辨率 (≈ 0.25mpp) 的 WSI 预测患者的 TTR。
  • 模型:从第一阶段选定的区域中提取 2048x2048 的 patches,并进行特征提取。使用 Cox Proportional Hazards (CPH) 模型进行回归,预测患者的复发风险 R。使用 top-k 和注意力池化选择最重要的特征进行预测。
  • 结果: 得到每个患者的 TTR 预测值。
  • 作用: 在更相关的区域内进行精细预测,提高预测准确率。

1.3 模型训练和评估

  • 使用 Adam 优化器进行训练。
  • 使用 AUC 和 C-index 作为评估指标。
  • 使用交叉验证选择最佳模型参数。

1.4 可解释性

  • 第一阶段生成注意力图,可视化最相关的区域。
  • 第二阶段使用注意力机制,突出显示对 TTR 预测最重要的区域。

2 结果

2.1 模型性能

  • 内部验证集: 在内部验证集上,该方法取得了 0.733 的平均 C-index (σ = 0.059),优于其他方法(MAD-MIL: 0.704 ± 0.058,AC-MIL: 0.714 ± 0.056)。
  • LEOPARD 挑战验证集: 在 LEOPARD 挑战验证集上,该方法取得了 0.603 的 C-index (CiRadboud = 0.616, Ciexternal = 0.589),表现良好。

2.2 消融实验结果

  • (A) 和 (C) 展示了在不同WSI百分比(m)下,不同top_k设置的比较。
  • (B) 和 (D) 比较了MAD-MIL、AC-MIL和我们提出的MIL方法在不同m参数下的最佳参数设置。
  • (A) 和 (B) 中的y轴代表在外保留集上评估的平均Ci值,而(C) 和 (D) 中的y轴代表Ci的标准差(σCi)。
  • x轴代表用于"慢速思考"阶段的图像块百分比。

2.2.1 结论

  • topk 和 m 的选择: 通过消融实验,发现当 topk = 30 且 m = 10% 时,模型性能最佳。这表明并非 WSI 的所有区域都对 TTR 预测同等重要,关注更相关的区域可以提高预测效率和准确率。
  • 与 MAD-MIL 和 AC-MIL 的比较: 在几乎所有的 m 参数设置下,该方法在 TTR 预测方面都优于 MAD-MIL 和 AC-MIL。

2.3 可解释性

2.3.1 注意力热图

  • 通过在组织图像上叠加注意力热图,可以直观地展示模型在进行预测时关注图像的哪些部分。
  • 热图中较暖的颜色(如红色)表示模型在做出分类或回归决策时认为更重要的区域。

2.3.2 图像展示

  • 图形中的左侧图像显示了整个WSI区域的注意力热图,而右侧图像则放大显示了左侧图像中选定的特定区域。
  • 这种放大视图有助于更细致地观察和分析模型在预测过程中特别关注的区域。

2.3.3 结论

  • 注意力机制: 该方法利用注意力机制来可视化模型的注意力区域,从而提高可解释性。
  • 注意力区域: 结果表明,注意力区域主要集中在肿瘤组织区域,这与临床知识相符。

2.4 局限性

该方法使用 CPH 模型进行风险预测,而非直接预测 TTR。未来可以考虑使用更直接的 TTR 预测模型。

2.5 未来方向

  • 其他肿瘤类型: 将该方法扩展到其他肿瘤类型的 TTR 预测。
  • 直接 TTR 预测: 使用更直接的 TTR 预测模型,例如生存分析模型。
相关推荐
珠海新立电子科技有限公司1 小时前
FPC柔性线路板与智能生活的融合
人工智能·生活·制造
IT古董2 小时前
【机器学习】机器学习中用到的高等数学知识-8. 图论 (Graph Theory)
人工智能·机器学习·图论
曼城周杰伦2 小时前
自然语言处理:第六十三章 阿里Qwen2 & 2.5系列
人工智能·阿里云·语言模型·自然语言处理·chatgpt·nlp·gpt-3
山海青风2 小时前
使用 OpenAI 进行数据探索性分析(EDA)
信息可视化·数据挖掘·数据分析
余炜yw3 小时前
【LSTM实战】跨越千年,赋诗成文:用LSTM重现唐诗的韵律与情感
人工智能·rnn·深度学习
莫叫石榴姐3 小时前
数据科学与SQL:组距分组分析 | 区间分布问题
大数据·人工智能·sql·深度学习·算法·机器学习·数据挖掘
如若1233 小时前
利用 `OpenCV` 和 `Matplotlib` 库进行图像读取、颜色空间转换、掩膜创建、颜色替换
人工智能·opencv·matplotlib
YRr YRr4 小时前
深度学习:神经网络中的损失函数的使用
人工智能·深度学习·神经网络
ChaseDreamRunner4 小时前
迁移学习理论与应用
人工智能·机器学习·迁移学习
Guofu_Liao4 小时前
大语言模型---梯度的简单介绍;梯度的定义;梯度计算的方法
人工智能·语言模型·矩阵·llama