NPJ Precis Oncol（IF=8）南京医科大学第一附属医院放射肿瘤科等团队：整合MRI与ECV的放射组学模型提高高级别胶质瘤进展预测准确性

文献学习

今天分享的文献是由南京医科大学第一附属医院放射肿瘤科等团队于2026年5月在肿瘤学顶刊《npj Precision Oncology 》（中科院1区top，IF=8）上发表的研究"Radiomics model integrating MRI and ECV enhances prediction accuracy for progression in high-grade glioma "即整合MRI与ECV的放射组学模型提高高级别胶质瘤进展预测准确性，该研究构建了一种基于MobileNet混合网络（MobHy-Net）的深度学习模型（DL_com），整合了T2-FLAIR、细胞外体积（ECV）图像及临床特征，用于预测高级别胶质瘤患者的一年内进展风险。模型在训练、内部验证和外部测试队列中的AUC分别达到0.954、0.911和0.919，显著优于单一模态模型。SHAP热图增强了模型的可解释性，决策曲线分析验证了其临床实用性。

创新点：① 首次将ECV（细胞外容积）图像 与多序列MRI结合，利用3D ViT提取微观血管及纤维化特征 ，突破传统结构影像局限。② 构建MobHy-Net混合网络 ，融合临床、T2-FLAIR与ECV多模态特征，预测AUC达0.919 ，显著优于单一模型。③ 引入SHAP热图可视化 ，揭示模型关注肿瘤实性核心区，增强深度学习"黑箱"的临床可解释性。

临床价值：①精准识别一年内高进展风险 患者（高危组mOS 26月 vs 低危组77月），助力个体化治疗决策。② 通过风险分层优化随访计划与治疗策略 ，避免低危患者过度治疗，提升医疗资源效率。③ 提供可视化预后依据，辅助放疗靶区勾画及疗效评估，促进医患沟通与精准神经肿瘤管理。

图 9：研究整体工作流程图

数据层：双中心临床数据→MRI/ECV影像→肿瘤分割

特征层：临床特征筛选、放射组学/拓扑特征提取、3D ViT深度学习特征提取

模型层：构建临床模型、放射组学模型、单序列DL模型、DL_com联合模型（MobHy-Net融合）

验证层：ROC/DCA/校准曲线/SHAP/生存分析

研究背景和目的

研究背景

高级别胶质瘤（HGG）是中枢神经系统最常见的原发性恶性肿瘤，具有高度侵袭性和极差的预后。尽管采用了最大安全切除、放疗联合替莫唑胺化疗等强化治疗方案，患者的中位生存期仍仅为15个月左右，五年生存率仅为6.6%至30.9% 。尤为关键的是，约半数患者在初次治疗后一年内即出现疾病进展 ，这部分患者的生存期显著缩短（中位总生存期仅15个月），而一年内未进展者可延长至56个月。因此，早期识别一年内进展的高危人群对于优化临床决策至关重要。然而，传统的基于临床参数和常规影像学特征的预测模型准确性和稳健性有限。近年来，影像组学通过从医学图像中提取高通量定量特征，在肿瘤诊断和预后预测中展现出潜力，但多数研究局限于常规MRI序列（如T1WI、T2-FLAIR）的形态和纹理信息，难以全面捕捉肿瘤微环境、微血管密度及空间异质性 。细胞外体积（ECV）作为一种功能成像参数，可反映组织纤维化和微血管密度，已在肝癌、胰腺癌等领域显示出预后价值，但在HGG进展预测中的应用尚不充分。此外，深度学习方法（如Vision Transformer）虽能自动提取高层次特征，但其在3D体积MRI数据上的应用及与ECV的融合仍缺乏系统研究。因此，亟需构建一种整合多序列MRI和ECV信息的深度学习模型，以提升HGG一年内进展风险的预测准确性。

研究目的

本研究旨在开发并验证一种基于MobHy‑Net（MobileNet与Transformer混合网络）的新型联合模型（DL_com） ，该模型整合了临床变量、T2-FLAIR序列的深度学习特征以及细胞外体积（ECV）图像的特征，用于预测高级别胶质瘤患者治疗结束后一年内的疾病进展风险 。具体目标包括：1）对比分析临床模型、传统影像组学模型、基于单一MRI序列（T1WI、T1C、T2-FLAIR）的深度学习模型以及基于ECV的深度学习模型的预测性能；2）通过受试者工作特征曲线（ROC）、校准曲线、决策曲线分析（DCA）以及DeLong检验 ，全面评估联合模型的区分度、校准度和临床净获益；3）利用SHAP算法生成热力图 ，可视化解释模型关注的关键肿瘤区域，增强模型的可解释性；4）通过Kaplan‑Meier生存曲线和Cox回归 ，根据模型预测的风险评分将患者分为高危和低危组，验证其对无进展生存期（PFS）和总生存期（OS）的分层能力。最终目标是为临床提供一种准确、可解释的风险分层工具，辅助个体化治疗决策和动态监测，从而推动神经肿瘤领域的精准医学实践。

数据和方法

研究数据

研究对象： 2016年6月-2023年6月，来自南京医科大学第一附属医院、中山大学孙逸仙纪念医院 两个中心的193例HGG患者；

**分组：**训练集93例、验证集40例、外部测试集60例，组间基线特征均衡（P>0.05）；

**数据类型：**术前多序列MRI（T1WI、T1C、T2-FLAIR）、ECV影像、临床特征、分子病理数据（IDH状态等）。

图 8：患者筛选流程图

技术方法

**影像预处理：**MRI空间配准、重采样、Z-Score标准化，数据增强；基于T1WI/T1C计算生成ECV影像；

**特征提取与筛选：**提取放射组学、拓扑特征，经t检验、Pearson相关、LASSO回归筛选关键特征；

模型构建：

构建3D Vision Transformer（3D ViT）深度学习模型，分别提取T1WI、T1C、T2-FLAIR、ECV单序列特征；

基于MobHy-Net融合临床特征+T2-FLAIR+ECV深度学习特征，构建联合模型DL_com；

**模型验证：**ROC曲线、校准曲线、决策曲线分析（DCA）评估性能；SHAP算法实现模型可解释性；Kaplan-Meier生存分析验证风险分层效能。

实验结果

①模型性能： DL_com模型表现最优，训练集AUC=0.954、验证集AUC=0.911、测试集AUC=0.919，准确率分别为89.2%、82.5%、88.3%，显著优于其他模型（P<0.05）；

**②对比优势：**DL_com较ECV单序列、T2-FLAIR单序列深度学习模型，测试集AUC分别提升24.1%、17.0%；

**③可解释性：**SHAP热图显示模型聚焦肿瘤实质区域，坏死/囊变/水肿区贡献度低，决策机制清晰；

**④风险分层：**模型将患者分为高/低风险组，高风险组中位总生存期（26个月）显著短于低风险组（77个月），无进展生存期差异显著（P<0.001）。

图 1：基于LASSO算法的临床特征选择

图1展示了临床特征筛选过程，包含三个子图。(a)为十折交叉验证系数路径图 ，横轴为Log(λ)，纵轴为各临床特征的系数值，随着λ增大，不相关特征的系数被压缩至零。(b)为均方误差随λ变化曲线 ，虚线对应最小MSE时的最优λ值，用于确定特征筛选的阈值。(c)为所选特征的重要性直方图（以线性SVM为例），显示年龄、病理类型、肿瘤体积、肿瘤方向、肿瘤位置和坏死六个因素被识别为关键临床风险因子。这些特征被用于构建后续的临床预测模型。

图 2：基于LASSO算法的放射组学与拓扑特征选择

图2展示了多序列MRI放射组学和拓扑特征的筛选流程。从初始提取的3077个独特特征 （含放射组学和拓扑特征）中，通过t检验、Pearson相关分析及LASSO回归逐步筛选。(a)显示十折交叉验证的系数路径，多数特征系数被压缩至零。(b)展示MSE随λ变化，确定最优正则化参数。(c)为最终筛选出的8个放射组学特征的重要性排序，而所有拓扑特征因贡献有限被完全排除，说明传统拓扑特征对本研究进展预测的增益不足。

图 3：各模型的ROC曲线对比

图3分别在训练集(a)、验证集(b)和测试集(c)中展示了临床模型、放射组学模型、DL_ecv、DL_t2及联合模型(DL_com)的ROC曲线。DL_com（深蓝色曲线 ）在所有三个队列中均表现出最优秀的区分能力，AUC分别达到0.954、0.911和0.919。相比之下，其他模型的AUC普遍在0.55-0.84之间。该图直观证明：整合T2-FLAIR、ECV和临床特征的深度学习联合模型显著优于单一模态或传统模型，尤其在外部测试集中保持了优异的泛化性能。

图 4：DeLong检验模型间AUC差异显著性

图4以气泡图 形式展示DeLong检验结果，横纵坐标分别对应不同模型对，气泡大小与p值呈负相关（p值越小，气泡越大）。(a)训练集、(b)验证集、(c)测试集中，DL_com与其他所有模型（临床、放射组学、DL_ecv、DL_t2等）比较时，p值均小于0.05（对应大尺寸气泡），表明AUC差异具有统计学显著性。图中红色或深色气泡集中在DL_com所在的行列，确认其预测性能的领先地位并非随机波动，为模型优越性提供了可靠的统计证据。

图 5：校准曲线与决策曲线分析

图5包含(a-c)校准曲线和(d-f)决策曲线，分别对应训练、验证和测试集。校准曲线中，DL_com（红色线） 贴近对角线（理想预测），显示预测概率与实际观察结果高度一致，而其他模型存在不同程度的偏离。决策曲线中，DL_com在大部分阈值概率范围内（约0.2-0.8）提供最高的净获益，表明其临床实用性最佳。例如在验证集(b,e)中，DL_com的净获益明显超越"全部干预"和"无干预"策略，证明该模型能有效指导临床决策，减少不必要的治疗或漏诊风险。

图 6：SHAP热力图可视化模型关注区域

图6左侧显示原始影像：ECV图(a)和T2-FLAIR图(b)；右侧为对应的SHAP热力图 ，红色代表对模型预测有显著正贡献 的区域，蓝色代表负贡献或中性。热力图中红色高亮区域主要集中于肿瘤实体成分中心 ，而坏死区、囊变区及周围水肿区域呈现蓝色或低贡献。这表明深度学习模型（DL_ecv和DL_t2）并非简单识别肿瘤轮廓，而是精准捕捉与进展风险相关的内部微结构特征。该可视化增强了"黑箱"模型的可解释性，有助于临床医生理解模型的决策依据。

图 7：基于联合模型的Kaplan-Meier生存曲线

图7展示DL_com将患者分为高风险组与低风险组后的生存分析结果。(a-c)为总生存期曲线：训练集中高风险组中位OS为26个月 ，低风险组为77个月 （log-rank p<0.01）；但验证集和测试集中OS差异未达统计学显著性（p>0.05），可能与样本量较小有关。(d-f)为无进展生存期曲线：训练集C-index=0.846（p<0.001），测试集C-index=0.793（p=0.003），两组间分离趋势明确。该图说明联合模型对短期进展风险的识别能力优于对总生存期的预测，尤其适用于一年内进展高危人群的早期筛选。

研究结论

该研究证实，结合多序列MRI、细胞外体积（ECV）影像和临床变量的深度学习模型（DL_com） ，能够显著提高对高级别胶质瘤（HGG）患者一年内疾病进展风险的预测准确性。在训练、验证和外部测试队列中，DL_com的AUC分别达到0.954、0.911和0.919，显著优于传统临床模型、放射组学模型以及基于单一序列的深度学习模型 。决策曲线分析和SHAP可视化热图进一步验证了该模型的临床实用性和可解释性。尤其值得关注的是，基于ECV影像的深度学习模型表现优于基于T2-FLAIR、T1WI等常规结构序列的模型 ，提示ECV能更全面地反映肿瘤微血管密度和纤维化异质性，增强对高风险人群的识别能力。通过X-tile确定的0.48风险阈值，DL_com成功将患者划分为高、低风险组，在训练集中两组总生存期（中位26个月 vs. 77个月）和无进展生存期均存在显著差异。尽管模型在外部验证中表现稳健，但研究也存在局限性：回顾性设计、样本量偏小、未收集患者自身血细胞比容（采用平均值计算ECV可能引入偏差），且拓扑特征对模型贡献有限。总体而言，该整合模型为HGG个体化治疗决策和动态监测提供了有潜力的无创工具，未来需前瞻性大样本研究进一步验证其泛化能力。

参考文献：Jiang G, Sun X, Zhu Y, Fei Y, Xu W, Jiang Z, Shao T, Cao Y, Li L, Zhou S. Radiomics model integrating MRI and ECV enhances prediction accuracy for progression in high-grade glioma. NPJ Precis Oncol. 2026 May 13. doi: 10.1038/s41698-026-01475-1.