NPJ Precis Oncol 青岛大学附属医院放射科王鹤翔：基于CT的可解释深度学习模型预测膀胱癌患者总生存期的多中心研究

文献信息

本次分享的文献是由青岛大学附属医院放射科王鹤翔、泌尿外科牛海涛联合广东省人民医院、中山大学附属第六医院和山东省立医院等团队近日（2025年8月16日）在《npj Precision Oncology》（中科院1区，IF=8.0）上发表的研究"An interpretable CT-based deep learning model for predicting overall survival in patients with bladder cancer: a multicenter study"即基于CT的可解释深度学习模型预测膀胱癌患者总生存期：一项多中心研究，开发了一个基于术前CT影像的深度学习模型（BCDL），用于预测膀胱癌患者的总生存期（OS），并通过多中心外部验证、可解释性分析和多组学关联研究，验证了其临床实用性和生物学基础。

Fig. 2 | 研究工作流程图

多中心数据收集 → CT图像获取与标注→图像预处理（重采样、标准化、ROI裁剪）→构建BCDL模型（3D DenseNet121，多分支结构，自归一化层）→模型训练与验证（Cox部分似然损失）→可解释性分析（CAM、SHAP）→多组学分析（RNA测序+免疫浸润+微生物群）→

研究背景及目标

研究背景

膀胱癌（Bladder Cancer，BCa）是全球第9大常见癌症和第13位肿瘤相关死亡原因。

目前膀胱癌的分型主要为 肌层浸润性（MIBC） 和 非肌层浸润性（NMIBC）。

尽管已有标准化治疗方案，但预后差异巨大，现有分层标准复杂，缺乏有效的预后生物标志物。

影像组学与深度学习在肿瘤预后预测中展现潜力，但深度学习模型的"黑箱"特性限制临床应用。

本研究引入SHAP（Shapley Additive Explanation）方法，提升模型可解释性，并结合多组学数据探究其生物学基础。

研究目标

开发并验证一个基于术前CT的可解释深度学习模型（Bladder Cancer Deep Learning，BCDL），用于预测膀胱癌患者的总生存（OS），并探索其潜在的生物学机制。

数据和方法

研究数据（Datasets）

总体数据来源

病例数 ：共纳入1456例膀胱癌患者

中心分布 ：来自4个中国大型医疗中心 ，并结合TCGA公共数据库

纳入时间：

训练队列（青岛大学附属医院）：2010年1月--2024年3月

验证队列1（广东省人民医院）：2016年1月--2023年12月

验证队列2（山东省立医院+濮阳油田总医院）：2012年1月--2018年12月

TCGA队列：公共影像与转录组数据

分组情况

训练队列：765例

验证队列1：438例

验证队列2：181例

TCGA队列：72例

随访时间：中位随访20--79个月不等

临床特征：包括年龄、性别、肿瘤大小、浸润情况、肿瘤形态、钙化、坏死等

Fig.1 | 患者临床特征分布

技术方法

影像处理与模型构建

使用**对比增强CT（肾实质期）**图像

基于DenseNet1213D卷积网络，结合Cox部分似然损失函数

引入多分支结构+自归一化层以增强多中心适应性

输出深度学习风险评分（DLscore）

对照模型

临床模型：基于Cox回归（变量：年龄、肿瘤轮廓、膀胱周脂肪浸润等）

影像组学模型：从CT提取1595个特征→特征选择（LASSO+AIC）→最终13个特征构建模型

融合模型：BCDL分数+独立临床危险因素

可解释性分析

CAM（类激活图）：可视化模型关注区域（肿瘤病灶）

SHAP（Shapley值）：像素级解释风险贡献（红=高风险，蓝=低风险）

统计学与验证

预测性能指标：C-index、时间依赖ROC、校准曲线、决策曲线分析（DCA）

生存分析：Kaplan--Meier+Log-rank检验

相关性分析：Spearman相关

治疗效益评估：倾向评分匹配（PSM，1:1匹配）

多组学功能探索

转录组（TCGA-BLCA数据）：差异基因分析（DESeq2），阈值|log2FC|>1，adjp<0.05

通路富集：GO/KEGG，GSEA（MSigDB）

免疫微环境：ssGSEA计算免疫细胞浸润差异

微生物群：BacteriainCancer数据库→物种注释（门/纲/目/科/属）+PLS-DA分析

统计学方法：线性判别分析效应量（LEfSe）用于筛选差异菌群

实验结果图

Fig. 3 | 各队列DL评分评估与可视化

展示了深度学习（DL）风险评分的分布特征、与生存状态的关联及模型可解释性结果，覆盖训练集及三个独立验证集。

Fig. 4 | 各队列预后模型性能对比

从鉴别效能、稳定性、校准度及临床获益四个维度，系统对比了BCDL模型与临床模型、放射组学模型、联合模型的性能差异。

Fig. 5 | BCDL模型对膀胱癌患者的预后分层

四个队列中基于DL评分分层的Kaplan-Meier生存曲线，用于评估模型的预后分层效能。

Fig. 6 | BCDL风险分组间的多组学差异

整合了转录组、免疫组、微生物组多维度数据，揭示高低风险组间的生物学差异，构建影像特征与分子机制的关联。

讨论

创新点：

首个针对**膀胱癌全类型（MIBC+NMIBC）**的多中心CT深度学习预后模型

使用SHAP提供像素级可解释性，解决深度学习"黑箱"问题

结合转录组+免疫+微生物组学，揭示影像-生物学联系

首次发现高风险组可从辅助治疗中显著获益，低风险女性为特殊亚群

局限性：

主要为中国人群，需更大规模国际前瞻性验证

仅分析总生存（OS），未涉及复发/无病生存

未细分特殊病理亚型（如变异型膀胱癌）

仅用单期（肾实质期）CT，信息量可能不足

临床价值：

可作为一种非侵入性预后工具，帮助分层管理膀胱癌患者

指导辅助治疗决策，避免过度治疗或治疗不足

为设计个体化临床试验提供参考

技术亮点：

基于DenseNet+多分支结构，适配多中心异质性

采用Cox部分似然损失，充分利用删失数据

结合PSM，减少治疗选择偏倚，提升临床相关性