NPJ Precis Oncol 青岛大学附属医院放射科王鹤翔:基于CT的可解释深度学习模型预测膀胱癌患者总生存期的多中心研究

01

文献信息

本次分享的文献是由青岛大学附属医院放射科王鹤翔、泌尿外科牛海涛联合广东省人民医院、中山大学附属第六医院和山东省立医院等团队近日(2025年8月16日)在《npj Precision Oncology》(中科院1区,IF=8.0)上发表的研究"An interpretable CT-based deep learning model for predicting overall survival in patients with bladder cancer: a multicenter study"即基于CT的可解释深度学习模型预测膀胱癌患者总生存期:一项多中心研究,开发了一个基于术前CT影像的深度学习模型(BCDL),用于预测膀胱癌患者的总生存期(OS),并通过多中心外部验证、可解释性分析和多组学关联研究,验证了其临床实用性和生物学基础。

Fig. 2 | 研究工作流程图

多中心数据收集 → CT图像获取与标注→图像预处理(重采样、标准化、ROI裁剪)→构建BCDL模型(3D DenseNet121,多分支结构,自归一化层)→模型训练与验证(Cox部分似然损失)→可解释性分析(CAM、SHAP)→多组学分析(RNA测序+免疫浸润+微生物群)→

02

研究背景及目标

研究背景

  • 膀胱癌(Bladder Cancer,BCa)是全球第9大常见癌症和第13位肿瘤相关死亡原因。
  • 目前膀胱癌的分型主要为 肌层浸润性(MIBC)非肌层浸润性(NMIBC)
  • 尽管已有标准化治疗方案,但预后差异巨大,现有分层标准复杂,缺乏有效的预后生物标志物。
  • 影像组学与深度学习在肿瘤预后预测中展现潜力,但深度学习模型的"黑箱"特性限制临床应用。
  • 本研究引入SHAP(Shapley Additive Explanation)方法,提升模型可解释性,并结合多组学数据探究其生物学基础。

研究目标

  • 开发并验证一个基于术前CT的可解释深度学习模型(Bladder Cancer Deep Learning,BCDL),用于预测膀胱癌患者的总生存(OS),并探索其潜在的生物学机制。

03

数据和方法

研究数据(Datasets)

总体数据来源

病例数 :共纳入1456例膀胱癌患者

中心分布 :来自4个中国大型医疗中心 ,并结合TCGA公共数据库

纳入时间

训练队列(青岛大学附属医院):2010年1月--2024年3月

验证队列1(广东省人民医院):2016年1月--2023年12月

验证队列2(山东省立医院+濮阳油田总医院):2012年1月--2018年12月

TCGA队列:公共影像与转录组数据

分组情况

训练队列:765例

验证队列1:438例

验证队列2:181例

TCGA队列:72例

随访时间:中位随访20--79个月不等

临床特征:包括年龄、性别、肿瘤大小、浸润情况、肿瘤形态、钙化、坏死等

Fig.1 | 患者临床特征分布


技术方法

影像处理与模型构建

使用**对比增强CT(肾实质期)**图像

基于DenseNet1213D卷积网络,结合Cox部分似然损失函数

引入多分支结构+自归一化层以增强多中心适应性

输出深度学习风险评分(DLscore)

对照模型

临床模型:基于Cox回归(变量:年龄、肿瘤轮廓、膀胱周脂肪浸润等)

影像组学模型:从CT提取1595个特征→特征选择(LASSO+AIC)→最终13个特征构建模型

融合模型:BCDL分数+独立临床危险因素

可解释性分析

CAM(类激活图):可视化模型关注区域(肿瘤病灶)

SHAP(Shapley值):像素级解释风险贡献(红=高风险,蓝=低风险)

统计学与验证

预测性能指标:C-index、时间依赖ROC、校准曲线、决策曲线分析(DCA)

生存分析:Kaplan--Meier+Log-rank检验

相关性分析:Spearman相关

治疗效益评估:倾向评分匹配(PSM,1:1匹配)

多组学功能探索

转录组(TCGA-BLCA数据):差异基因分析(DESeq2),阈值|log2FC|>1,adjp<0.05

通路富集:GO/KEGG,GSEA(MSigDB)

免疫微环境:ssGSEA计算免疫细胞浸润差异

微生物群:BacteriainCancer数据库→物种注释(门/纲/目/科/属)+PLS-DA分析

统计学方法:线性判别分析效应量(LEfSe)用于筛选差异菌群

04

实验结果图

Fig. 3 | 各队列DL评分评估与可视化

展示了深度学习(DL)风险评分的分布特征、与生存状态的关联及模型可解释性结果,覆盖训练集及三个独立验证集。

Fig. 4 | 各队列预后模型性能对比

从鉴别效能、稳定性、校准度及临床获益四个维度,系统对比了BCDL模型与临床模型、放射组学模型、联合模型的性能差异。

Fig. 5 | BCDL模型对膀胱癌患者的预后分层

四个队列中基于DL评分分层的Kaplan-Meier生存曲线,用于评估模型的预后分层效能。

Fig. 6 | BCDL风险分组间的多组学差异

整合了转录组、免疫组、微生物组多维度数据,揭示高低风险组间的生物学差异,构建影像特征与分子机制的关联。

05

讨论

创新点

  • 首个针对**膀胱癌全类型(MIBC+NMIBC)**的多中心CT深度学习预后模型
  • 使用SHAP提供像素级可解释性,解决深度学习"黑箱"问题
  • 结合转录组+免疫+微生物组学,揭示影像-生物学联系
  • 首次发现高风险组可从辅助治疗中显著获益,低风险女性为特殊亚群

局限性

  • 主要为中国人群,需更大规模国际前瞻性验证
  • 仅分析总生存(OS),未涉及复发/无病生存
  • 未细分特殊病理亚型(如变异型膀胱癌)
  • 仅用单期(肾实质期)CT,信息量可能不足

临床价值

  • 可作为一种非侵入性预后工具,帮助分层管理膀胱癌患者
  • 指导辅助治疗决策,避免过度治疗或治疗不足
  • 为设计个体化临床试验提供参考

技术亮点

  • 基于DenseNet+多分支结构,适配多中心异质性
  • 采用Cox部分似然损失,充分利用删失数据
  • 结合PSM,减少治疗选择偏倚,提升临床相关性
相关推荐
程序员cxuan4 小时前
为每个任务配一套 harness:Claude Code 里的动态工作流
人工智能
程序员cxuan4 小时前
Claude Fable 5 来了
人工智能·后端·程序员
云边云科技_云网融合4 小时前
云边云科技亮相 2026 WOD 制造业数智化博览会 云网融合赋能制造焕新
人工智能·科技·安全·制造
Σίσυφος19005 小时前
激光三角 光平面标定-多高度误差分析
人工智能·计算机视觉·平面
JS菌5 小时前
手写一个 AI Agent 全栈项目:从沙箱执行到子智能体的完整实现
前端·人工智能·后端
lqqjuly5 小时前
前沿算法深度解析(二)
人工智能·算法·机器学习
Bode_20025 小时前
基于大数据分析的全生命周期质量追溯质量评估体系落地方案
大数据·人工智能
分布式存储与RustFS5 小时前
RustFS S3 Table 开源后,我重新梳理了一下 Iceberg 数据湖的选型思路
人工智能·开源·minio·dpu·rustfs·ai存储·s3 table
DevOpenClub6 小时前
用 Agent 搭建网页内容采集与结构化处理流水线
人工智能
56AI6 小时前
2026 企业级AI智能体开发平台推荐:聚焦底层安全与准确率的智能体平台
人工智能·安全·智能体