NPJ Precis Oncol 青岛大学附属医院放射科王鹤翔:基于CT的可解释深度学习模型预测膀胱癌患者总生存期的多中心研究

01

文献信息

本次分享的文献是由青岛大学附属医院放射科王鹤翔、泌尿外科牛海涛联合广东省人民医院、中山大学附属第六医院和山东省立医院等团队近日(2025年8月16日)在《npj Precision Oncology》(中科院1区,IF=8.0)上发表的研究"An interpretable CT-based deep learning model for predicting overall survival in patients with bladder cancer: a multicenter study"即基于CT的可解释深度学习模型预测膀胱癌患者总生存期:一项多中心研究,开发了一个基于术前CT影像的深度学习模型(BCDL),用于预测膀胱癌患者的总生存期(OS),并通过多中心外部验证、可解释性分析和多组学关联研究,验证了其临床实用性和生物学基础。

Fig. 2 | 研究工作流程图

多中心数据收集 → CT图像获取与标注→图像预处理(重采样、标准化、ROI裁剪)→构建BCDL模型(3D DenseNet121,多分支结构,自归一化层)→模型训练与验证(Cox部分似然损失)→可解释性分析(CAM、SHAP)→多组学分析(RNA测序+免疫浸润+微生物群)→

02

研究背景及目标

研究背景

  • 膀胱癌(Bladder Cancer,BCa)是全球第9大常见癌症和第13位肿瘤相关死亡原因。
  • 目前膀胱癌的分型主要为 肌层浸润性(MIBC)非肌层浸润性(NMIBC)
  • 尽管已有标准化治疗方案,但预后差异巨大,现有分层标准复杂,缺乏有效的预后生物标志物。
  • 影像组学与深度学习在肿瘤预后预测中展现潜力,但深度学习模型的"黑箱"特性限制临床应用。
  • 本研究引入SHAP(Shapley Additive Explanation)方法,提升模型可解释性,并结合多组学数据探究其生物学基础。

研究目标

  • 开发并验证一个基于术前CT的可解释深度学习模型(Bladder Cancer Deep Learning,BCDL),用于预测膀胱癌患者的总生存(OS),并探索其潜在的生物学机制。

03

数据和方法

研究数据(Datasets)

总体数据来源

病例数 :共纳入1456例膀胱癌患者

中心分布 :来自4个中国大型医疗中心 ,并结合TCGA公共数据库

纳入时间

训练队列(青岛大学附属医院):2010年1月--2024年3月

验证队列1(广东省人民医院):2016年1月--2023年12月

验证队列2(山东省立医院+濮阳油田总医院):2012年1月--2018年12月

TCGA队列:公共影像与转录组数据

分组情况

训练队列:765例

验证队列1:438例

验证队列2:181例

TCGA队列:72例

随访时间:中位随访20--79个月不等

临床特征:包括年龄、性别、肿瘤大小、浸润情况、肿瘤形态、钙化、坏死等

Fig.1 | 患者临床特征分布


技术方法

影像处理与模型构建

使用**对比增强CT(肾实质期)**图像

基于DenseNet1213D卷积网络,结合Cox部分似然损失函数

引入多分支结构+自归一化层以增强多中心适应性

输出深度学习风险评分(DLscore)

对照模型

临床模型:基于Cox回归(变量:年龄、肿瘤轮廓、膀胱周脂肪浸润等)

影像组学模型:从CT提取1595个特征→特征选择(LASSO+AIC)→最终13个特征构建模型

融合模型:BCDL分数+独立临床危险因素

可解释性分析

CAM(类激活图):可视化模型关注区域(肿瘤病灶)

SHAP(Shapley值):像素级解释风险贡献(红=高风险,蓝=低风险)

统计学与验证

预测性能指标:C-index、时间依赖ROC、校准曲线、决策曲线分析(DCA)

生存分析:Kaplan--Meier+Log-rank检验

相关性分析:Spearman相关

治疗效益评估:倾向评分匹配(PSM,1:1匹配)

多组学功能探索

转录组(TCGA-BLCA数据):差异基因分析(DESeq2),阈值|log2FC|>1,adjp<0.05

通路富集:GO/KEGG,GSEA(MSigDB)

免疫微环境:ssGSEA计算免疫细胞浸润差异

微生物群:BacteriainCancer数据库→物种注释(门/纲/目/科/属)+PLS-DA分析

统计学方法:线性判别分析效应量(LEfSe)用于筛选差异菌群

04

实验结果图

Fig. 3 | 各队列DL评分评估与可视化

展示了深度学习(DL)风险评分的分布特征、与生存状态的关联及模型可解释性结果,覆盖训练集及三个独立验证集。

Fig. 4 | 各队列预后模型性能对比

从鉴别效能、稳定性、校准度及临床获益四个维度,系统对比了BCDL模型与临床模型、放射组学模型、联合模型的性能差异。

Fig. 5 | BCDL模型对膀胱癌患者的预后分层

四个队列中基于DL评分分层的Kaplan-Meier生存曲线,用于评估模型的预后分层效能。

Fig. 6 | BCDL风险分组间的多组学差异

整合了转录组、免疫组、微生物组多维度数据,揭示高低风险组间的生物学差异,构建影像特征与分子机制的关联。

05

讨论

创新点

  • 首个针对**膀胱癌全类型(MIBC+NMIBC)**的多中心CT深度学习预后模型
  • 使用SHAP提供像素级可解释性,解决深度学习"黑箱"问题
  • 结合转录组+免疫+微生物组学,揭示影像-生物学联系
  • 首次发现高风险组可从辅助治疗中显著获益,低风险女性为特殊亚群

局限性

  • 主要为中国人群,需更大规模国际前瞻性验证
  • 仅分析总生存(OS),未涉及复发/无病生存
  • 未细分特殊病理亚型(如变异型膀胱癌)
  • 仅用单期(肾实质期)CT,信息量可能不足

临床价值

  • 可作为一种非侵入性预后工具,帮助分层管理膀胱癌患者
  • 指导辅助治疗决策,避免过度治疗或治疗不足
  • 为设计个体化临床试验提供参考

技术亮点

  • 基于DenseNet+多分支结构,适配多中心异质性
  • 采用Cox部分似然损失,充分利用删失数据
  • 结合PSM,减少治疗选择偏倚,提升临床相关性
相关推荐
端平入洛7 小时前
迁移学习的"最小调参模块"
人工智能·深度学习
狒狒热知识7 小时前
软文发稿行业深度洗牌专业平台成企业品牌营销核心依托
大数据·人工智能
普密斯科技7 小时前
在线图像测量仪实战案例:医疗西林瓶尺寸检测的精准解决方案
大数据·人工智能·计算机视觉·健康医疗·测量
Biocloudy7 小时前
信号分子:从 CD8⁺ T 细胞到癌症免疫疗法
大数据·人工智能·经验分享·其他
AI人工智能+7 小时前
不动产权证书识别技术:融合了计算机视觉、自然语言处理(NLP)和人工智能的深度技术栈
人工智能·计算机视觉·语言模型·ocr·不动产权证书识别
绝知此事7 小时前
【产品更名】通义灵码升级为 Qoder CN:AI 编码助手新时代,附大模型收费与 Spring Boot 支持全对比
人工智能·spring boot·后端·idea·ai编程
无忧智库7 小时前
某制造企业售后服务智能体(Agent)工单自动分派与处置闭环系统详细设计方案(WORD)
大数据·人工智能·制造
Agent产品评测局7 小时前
国企制造企业vs民营工厂,AI Agent方案选型对比 —— 2026制造业智能体落地全景拆解
人工智能·ai·chatgpt·制造
穗余7 小时前
2026 AI x Web3 School共学营笔记-Day2
人工智能·区块链