NPJ Precis Oncol 青岛大学附属医院放射科王鹤翔:基于CT的可解释深度学习模型预测膀胱癌患者总生存期的多中心研究

01

文献信息

本次分享的文献是由青岛大学附属医院放射科王鹤翔、泌尿外科牛海涛联合广东省人民医院、中山大学附属第六医院和山东省立医院等团队近日(2025年8月16日)在《npj Precision Oncology》(中科院1区,IF=8.0)上发表的研究"An interpretable CT-based deep learning model for predicting overall survival in patients with bladder cancer: a multicenter study"即基于CT的可解释深度学习模型预测膀胱癌患者总生存期:一项多中心研究,开发了一个基于术前CT影像的深度学习模型(BCDL),用于预测膀胱癌患者的总生存期(OS),并通过多中心外部验证、可解释性分析和多组学关联研究,验证了其临床实用性和生物学基础。

Fig. 2 | 研究工作流程图

多中心数据收集 → CT图像获取与标注→图像预处理(重采样、标准化、ROI裁剪)→构建BCDL模型(3D DenseNet121,多分支结构,自归一化层)→模型训练与验证(Cox部分似然损失)→可解释性分析(CAM、SHAP)→多组学分析(RNA测序+免疫浸润+微生物群)→

02

研究背景及目标

研究背景

  • 膀胱癌(Bladder Cancer,BCa)是全球第9大常见癌症和第13位肿瘤相关死亡原因。
  • 目前膀胱癌的分型主要为 肌层浸润性(MIBC)非肌层浸润性(NMIBC)
  • 尽管已有标准化治疗方案,但预后差异巨大,现有分层标准复杂,缺乏有效的预后生物标志物。
  • 影像组学与深度学习在肿瘤预后预测中展现潜力,但深度学习模型的"黑箱"特性限制临床应用。
  • 本研究引入SHAP(Shapley Additive Explanation)方法,提升模型可解释性,并结合多组学数据探究其生物学基础。

研究目标

  • 开发并验证一个基于术前CT的可解释深度学习模型(Bladder Cancer Deep Learning,BCDL),用于预测膀胱癌患者的总生存(OS),并探索其潜在的生物学机制。

03

数据和方法

研究数据(Datasets)

总体数据来源

病例数 :共纳入1456例膀胱癌患者

中心分布 :来自4个中国大型医疗中心 ,并结合TCGA公共数据库

纳入时间

训练队列(青岛大学附属医院):2010年1月--2024年3月

验证队列1(广东省人民医院):2016年1月--2023年12月

验证队列2(山东省立医院+濮阳油田总医院):2012年1月--2018年12月

TCGA队列:公共影像与转录组数据

分组情况

训练队列:765例

验证队列1:438例

验证队列2:181例

TCGA队列:72例

随访时间:中位随访20--79个月不等

临床特征:包括年龄、性别、肿瘤大小、浸润情况、肿瘤形态、钙化、坏死等

Fig.1 | 患者临床特征分布


技术方法

影像处理与模型构建

使用**对比增强CT(肾实质期)**图像

基于DenseNet1213D卷积网络,结合Cox部分似然损失函数

引入多分支结构+自归一化层以增强多中心适应性

输出深度学习风险评分(DLscore)

对照模型

临床模型:基于Cox回归(变量:年龄、肿瘤轮廓、膀胱周脂肪浸润等)

影像组学模型:从CT提取1595个特征→特征选择(LASSO+AIC)→最终13个特征构建模型

融合模型:BCDL分数+独立临床危险因素

可解释性分析

CAM(类激活图):可视化模型关注区域(肿瘤病灶)

SHAP(Shapley值):像素级解释风险贡献(红=高风险,蓝=低风险)

统计学与验证

预测性能指标:C-index、时间依赖ROC、校准曲线、决策曲线分析(DCA)

生存分析:Kaplan--Meier+Log-rank检验

相关性分析:Spearman相关

治疗效益评估:倾向评分匹配(PSM,1:1匹配)

多组学功能探索

转录组(TCGA-BLCA数据):差异基因分析(DESeq2),阈值|log2FC|>1,adjp<0.05

通路富集:GO/KEGG,GSEA(MSigDB)

免疫微环境:ssGSEA计算免疫细胞浸润差异

微生物群:BacteriainCancer数据库→物种注释(门/纲/目/科/属)+PLS-DA分析

统计学方法:线性判别分析效应量(LEfSe)用于筛选差异菌群

04

实验结果图

Fig. 3 | 各队列DL评分评估与可视化

展示了深度学习(DL)风险评分的分布特征、与生存状态的关联及模型可解释性结果,覆盖训练集及三个独立验证集。

Fig. 4 | 各队列预后模型性能对比

从鉴别效能、稳定性、校准度及临床获益四个维度,系统对比了BCDL模型与临床模型、放射组学模型、联合模型的性能差异。

Fig. 5 | BCDL模型对膀胱癌患者的预后分层

四个队列中基于DL评分分层的Kaplan-Meier生存曲线,用于评估模型的预后分层效能。

Fig. 6 | BCDL风险分组间的多组学差异

整合了转录组、免疫组、微生物组多维度数据,揭示高低风险组间的生物学差异,构建影像特征与分子机制的关联。

05

讨论

创新点

  • 首个针对**膀胱癌全类型(MIBC+NMIBC)**的多中心CT深度学习预后模型
  • 使用SHAP提供像素级可解释性,解决深度学习"黑箱"问题
  • 结合转录组+免疫+微生物组学,揭示影像-生物学联系
  • 首次发现高风险组可从辅助治疗中显著获益,低风险女性为特殊亚群

局限性

  • 主要为中国人群,需更大规模国际前瞻性验证
  • 仅分析总生存(OS),未涉及复发/无病生存
  • 未细分特殊病理亚型(如变异型膀胱癌)
  • 仅用单期(肾实质期)CT,信息量可能不足

临床价值

  • 可作为一种非侵入性预后工具,帮助分层管理膀胱癌患者
  • 指导辅助治疗决策,避免过度治疗或治疗不足
  • 为设计个体化临床试验提供参考

技术亮点

  • 基于DenseNet+多分支结构,适配多中心异质性
  • 采用Cox部分似然损失,充分利用删失数据
  • 结合PSM,减少治疗选择偏倚,提升临床相关性
相关推荐
阿里云大数据AI技术33 分钟前
Agentic Memory Extension 支持对接主流Agent - 适用于 Claude Code、CodeX等
人工智能·agent
我唔知啊42 分钟前
不是让 AI 写代码,我是在指挥 AI 干活:一套打磨出来的 AI 编程工作流
人工智能
ZzT1 小时前
在 GitHub 上 @一下 claude,它自己把 issue 改成 PR
人工智能·开源
不加辣椒1 小时前
第15章 上下文窗口管理与长文本策略
人工智能
牛奶2 小时前
AI 能赚钱了——但赚的不是你
人工智能·ai编程·nvidia
凌杰2 小时前
AI 学习笔记:研究方法的演变
人工智能
半盏药香3 小时前
由于jinja2的starlette版本过高引发的问题:500 Server Error TypeError: unhashable type: 'dict'
人工智能
阿里云大数据AI技术3 小时前
MiniMax M3、Kimi K2.7 Code来啦!PAI已支持一键部署,开源前沿触手可及
人工智能·agent
百度Geek说3 小时前
AI Coding 的底层框架:一切优化都是在对抗熵增
人工智能
Java研究者3 小时前
AI智能体研发 | 什么是OpenAI API协议
人工智能·大模型·openai·api·agent·智能体