01
文献信息

本次分享的文献是由青岛大学附属医院放射科王鹤翔、泌尿外科牛海涛联合广东省人民医院、中山大学附属第六医院和山东省立医院等团队近日(2025年8月16日)在《npj Precision Oncology》(中科院1区,IF=8.0)上发表的研究"An interpretable CT-based deep learning model for predicting overall survival in patients with bladder cancer: a multicenter study"即基于CT的可解释深度学习模型预测膀胱癌患者总生存期:一项多中心研究,开发了一个基于术前CT影像的深度学习模型(BCDL),用于预测膀胱癌患者的总生存期(OS),并通过多中心外部验证、可解释性分析和多组学关联研究,验证了其临床实用性和生物学基础。

Fig. 2 | 研究工作流程图
多中心数据收集 → CT图像获取与标注→图像预处理(重采样、标准化、ROI裁剪)→构建BCDL模型(3D DenseNet121,多分支结构,自归一化层)→模型训练与验证(Cox部分似然损失)→可解释性分析(CAM、SHAP)→多组学分析(RNA测序+免疫浸润+微生物群)→
02
研究背景及目标
研究背景
- 膀胱癌(Bladder Cancer,BCa)是全球第9大常见癌症和第13位肿瘤相关死亡原因。
- 目前膀胱癌的分型主要为 肌层浸润性(MIBC) 和 非肌层浸润性(NMIBC)。
- 尽管已有标准化治疗方案,但预后差异巨大,现有分层标准复杂,缺乏有效的预后生物标志物。
- 影像组学与深度学习在肿瘤预后预测中展现潜力,但深度学习模型的"黑箱"特性限制临床应用。
- 本研究引入SHAP(Shapley Additive Explanation)方法,提升模型可解释性,并结合多组学数据探究其生物学基础。
研究目标
- 开发并验证一个基于术前CT的可解释深度学习模型(Bladder Cancer Deep Learning,BCDL),用于预测膀胱癌患者的总生存(OS),并探索其潜在的生物学机制。
03
数据和方法
研究数据(Datasets)
总体数据来源
病例数 :共纳入1456例膀胱癌患者
中心分布 :来自4个中国大型医疗中心 ,并结合TCGA公共数据库
纳入时间:
训练队列(青岛大学附属医院):2010年1月--2024年3月
验证队列1(广东省人民医院):2016年1月--2023年12月
验证队列2(山东省立医院+濮阳油田总医院):2012年1月--2018年12月
TCGA队列:公共影像与转录组数据
分组情况
训练队列:765例
验证队列1:438例
验证队列2:181例
TCGA队列:72例
随访时间:中位随访20--79个月不等
临床特征:包括年龄、性别、肿瘤大小、浸润情况、肿瘤形态、钙化、坏死等

Fig.1 | 患者临床特征分布
技术方法
影像处理与模型构建
使用**对比增强CT(肾实质期)**图像
基于DenseNet1213D卷积网络,结合Cox部分似然损失函数
引入多分支结构+自归一化层以增强多中心适应性
输出深度学习风险评分(DLscore)
对照模型
临床模型:基于Cox回归(变量:年龄、肿瘤轮廓、膀胱周脂肪浸润等)
影像组学模型:从CT提取1595个特征→特征选择(LASSO+AIC)→最终13个特征构建模型
融合模型:BCDL分数+独立临床危险因素
可解释性分析
CAM(类激活图):可视化模型关注区域(肿瘤病灶)
SHAP(Shapley值):像素级解释风险贡献(红=高风险,蓝=低风险)
统计学与验证
预测性能指标:C-index、时间依赖ROC、校准曲线、决策曲线分析(DCA)
生存分析:Kaplan--Meier+Log-rank检验
相关性分析:Spearman相关
治疗效益评估:倾向评分匹配(PSM,1:1匹配)
多组学功能探索
转录组(TCGA-BLCA数据):差异基因分析(DESeq2),阈值|log2FC|>1,adjp<0.05
通路富集:GO/KEGG,GSEA(MSigDB)
免疫微环境:ssGSEA计算免疫细胞浸润差异
微生物群:BacteriainCancer数据库→物种注释(门/纲/目/科/属)+PLS-DA分析
统计学方法:线性判别分析效应量(LEfSe)用于筛选差异菌群
04
实验结果图

Fig. 3 | 各队列DL评分评估与可视化
展示了深度学习(DL)风险评分的分布特征、与生存状态的关联及模型可解释性结果,覆盖训练集及三个独立验证集。

Fig. 4 | 各队列预后模型性能对比
从鉴别效能、稳定性、校准度及临床获益四个维度,系统对比了BCDL模型与临床模型、放射组学模型、联合模型的性能差异。

Fig. 5 | BCDL模型对膀胱癌患者的预后分层
四个队列中基于DL评分分层的Kaplan-Meier生存曲线,用于评估模型的预后分层效能。

Fig. 6 | BCDL风险分组间的多组学差异
整合了转录组、免疫组、微生物组多维度数据,揭示高低风险组间的生物学差异,构建影像特征与分子机制的关联。
05
讨论
创新点:
- 首个针对**膀胱癌全类型(MIBC+NMIBC)**的多中心CT深度学习预后模型
- 使用SHAP提供像素级可解释性,解决深度学习"黑箱"问题
- 结合转录组+免疫+微生物组学,揭示影像-生物学联系
- 首次发现高风险组可从辅助治疗中显著获益,低风险女性为特殊亚群
局限性:
- 主要为中国人群,需更大规模国际前瞻性验证
- 仅分析总生存(OS),未涉及复发/无病生存
- 未细分特殊病理亚型(如变异型膀胱癌)
- 仅用单期(肾实质期)CT,信息量可能不足
临床价值:
- 可作为一种非侵入性预后工具,帮助分层管理膀胱癌患者
- 指导辅助治疗决策,避免过度治疗或治疗不足
- 为设计个体化临床试验提供参考
技术亮点:
- 基于DenseNet+多分支结构,适配多中心异质性
- 采用Cox部分似然损失,充分利用删失数据
- 结合PSM,减少治疗选择偏倚,提升临床相关性