AI在医学领域:MIL回归用于前列腺癌复发预测

2024年,全球男性新癌症病例预计为1029080例,其中前列腺癌病例预计为29%。前列腺癌是男性中第二常见的癌症类型,仅次于肺癌。它主要影响老年男性,且发病率随年龄增长而增加。前列腺癌的主要治疗方法是前列腺切除术,但术后复发率较高(高达 40%)。++++格里森评分(Gleason score)是当前用于评估前列腺癌风险等级的主要方法,它基于组织形态学特征进行分级++++。尽管格里森评分在临床上广泛应用,但它存在局限性,同一格里森评分等级内的复发率存在差异。近年来,深度学习方法开始被用于分析组织微阵列的数字化组织学图像,以预测生化复发。这些方法相较于传统的格里森评分,显示出了更高的预测准确性。

++++本文提出了一种两阶段的 MIL 回归方法来预测前列腺癌的生物化学复发时间(TTR)。该方法采用"快速思考 & 慢速思考"策略,旨在提高斑块采样/池化和推理效率。++++

++++源代码网址:https://github.com/++**++** ++++yousuhang/IU-ComPath-LeoPard++++

1 方法

本文提出了一种基于多实例学习的两阶段方法,用于预测前列腺癌患者的生化复发时间 (TTR)。该方法遵循"快思考 & 慢思考"的策略,以提高预测效率和准确率。

1.1 快速定位 (Thinking Fast)

  • 目标: 快速找到与生化复发最相关的 WSI 区域。
  • 分辨率: 使用低分辨率 (≈ 16mpp) 的 WSI 进行预测,以减少推理时间。
  • 模型: 使用 CLAM-SB 模型进行分类,判断每个 WSI 是否会在特定时间阈值 T 内复发。
  • 结果: 生成每个区域的注意力图,并选择注意力得分最高的前 m% (最多 40%) 区域。
  • 作用: 过滤掉不相关的组织,为第二阶段的预测提供更精准的区域。

1.2 精细预测 (Thinking Slow)

  • 目标: 利用高分辨率 (≈ 0.25mpp) 的 WSI 预测患者的 TTR。
  • 模型:从第一阶段选定的区域中提取 2048x2048 的 patches,并进行特征提取。使用 Cox Proportional Hazards (CPH) 模型进行回归,预测患者的复发风险 R。使用 top-k 和注意力池化选择最重要的特征进行预测。
  • 结果: 得到每个患者的 TTR 预测值。
  • 作用: 在更相关的区域内进行精细预测,提高预测准确率。

1.3 模型训练和评估

  • 使用 Adam 优化器进行训练。
  • 使用 AUC 和 C-index 作为评估指标。
  • 使用交叉验证选择最佳模型参数。

1.4 可解释性

  • 第一阶段生成注意力图,可视化最相关的区域。
  • 第二阶段使用注意力机制,突出显示对 TTR 预测最重要的区域。

2 结果

2.1 模型性能

  • 内部验证集: 在内部验证集上,该方法取得了 0.733 的平均 C-index (σ = 0.059),优于其他方法(MAD-MIL: 0.704 ± 0.058,AC-MIL: 0.714 ± 0.056)。
  • LEOPARD 挑战验证集: 在 LEOPARD 挑战验证集上,该方法取得了 0.603 的 C-index (CiRadboud = 0.616, Ciexternal = 0.589),表现良好。

2.2 消融实验结果

  • (A) 和 (C) 展示了在不同WSI百分比(m)下,不同top_k设置的比较。
  • (B) 和 (D) 比较了MAD-MIL、AC-MIL和我们提出的MIL方法在不同m参数下的最佳参数设置。
  • (A) 和 (B) 中的y轴代表在外保留集上评估的平均Ci值,而(C) 和 (D) 中的y轴代表Ci的标准差(σCi)。
  • x轴代表用于"慢速思考"阶段的图像块百分比。

2.2.1 结论

  • topk 和 m 的选择: 通过消融实验,发现当 topk = 30 且 m = 10% 时,模型性能最佳。这表明并非 WSI 的所有区域都对 TTR 预测同等重要,关注更相关的区域可以提高预测效率和准确率。
  • 与 MAD-MIL 和 AC-MIL 的比较: 在几乎所有的 m 参数设置下,该方法在 TTR 预测方面都优于 MAD-MIL 和 AC-MIL。

2.3 可解释性

2.3.1 注意力热图

  • 通过在组织图像上叠加注意力热图,可以直观地展示模型在进行预测时关注图像的哪些部分。
  • 热图中较暖的颜色(如红色)表示模型在做出分类或回归决策时认为更重要的区域。

2.3.2 图像展示

  • 图形中的左侧图像显示了整个WSI区域的注意力热图,而右侧图像则放大显示了左侧图像中选定的特定区域。
  • 这种放大视图有助于更细致地观察和分析模型在预测过程中特别关注的区域。

2.3.3 结论

  • 注意力机制: 该方法利用注意力机制来可视化模型的注意力区域,从而提高可解释性。
  • 注意力区域: 结果表明,注意力区域主要集中在肿瘤组织区域,这与临床知识相符。

2.4 局限性

该方法使用 CPH 模型进行风险预测,而非直接预测 TTR。未来可以考虑使用更直接的 TTR 预测模型。

2.5 未来方向

  • 其他肿瘤类型: 将该方法扩展到其他肿瘤类型的 TTR 预测。
  • 直接 TTR 预测: 使用更直接的 TTR 预测模型,例如生存分析模型。
相关推荐
数据皮皮侠AI2 小时前
中国城市可再生能源数据集(2005-2021)|顶刊 Sci Data 11 种能源面板
大数据·人工智能·笔记·能源·1024程序员节
G31135422732 小时前
如何用 QClaw 龙虾做一个规律作息健康助理 Agent
大数据·人工智能·ai·云计算
幂律智能2 小时前
零售行业合同管理数智化转型解决方案
大数据·人工智能·零售
旺财矿工2 小时前
零基础搭建 OpenClaw 2.6.6 Win11 本地化运行环境
人工智能·openclaw·小龙虾·龙虾·openclaw安装包
九成宫2 小时前
动手学深度学习PyTorch版初步安装过程
人工智能·pytorch·深度学习
Traving Yu2 小时前
Prompt提示词工程
人工智能·prompt
NOCSAH2 小时前
统好AI CRM功能解析:智能录入与跟进
人工智能
He少年2 小时前
【AI 辅助编程做设备数据采集:一个真实项目的迭代复盘(OpenSpec 驱动)】
人工智能
华万通信king2 小时前
WorkBuddy知识库企业级搭建实战:从零到生产级别的完整路径
大数据·人工智能
测试员周周2 小时前
【AI测试系统】第3篇:AI生成的测试用例太“水”?14年老兵:规则引擎+AI才是王炸组合
人工智能·python·测试