01
导语
近年来,影像组学的发展已经逐渐从"做预测"进入"讲机制"的阶段。过去大量研究往往停留在模型性能层面,例如预测分期、复发或疗效,但始终面临一个核心质疑:影像特征究竟对应了什么生物学本质?为什么一组纹理参数能够反映肿瘤行为? 也正因为缺乏机制支撑,传统影像组学常被认为是"黑箱模型",难以真正获得临床与生物学层面的认可。而这篇发表于《Radiology》的研究,真正值得学习的地方,并不只是建立了一个术前预测CMS4的MRI影像组学模型,而是首次较为完整地构建了一条 "影像表型---肿瘤微环境---CAF激活---TGF-β/EMT通路---CMS4恶性生物学" 的逻辑链条。作者不再把影像组学当作单纯的统计工具,而是将其视为一种能够感知肿瘤微环境生态的"生物学传感器",并通过bulk RNA-seq、单细胞测序以及CAF亚群分析,证明MRI异质性背后对应的是CAF驱动的间质重塑与血管生成。这种从临床问题逐步落到分子机制,再回到临床转化的研究范式,正代表着当前顶级影像组学最重要的发展方向:影像组学不再只是"预测学",而正在进入"机制影像学"时代。

**★题目:**Interpretable MRI-based Multiparametric Radiomics for Preoperative Prediction of CMS4 Colorectal Cancer
(基于可解释MRI多参数影像组学术前预测结直肠癌CMS4亚型)
★期刊:《Radiology》(中科院1区,IF=15.2)
**★研究疾病:**结直肠癌(CRC)
**★生物学机制:**TGF-β信号通路的激活、上皮-间充质转化(EMT)、血管生成
**★发表时间:**2026年5月
02
研究背景-从 "临床问题" 落到 "生物学问题"
结直肠癌是全球高发恶性肿瘤,其高度异质性 导致患者预后和治疗反应差异显著。2015年提出的共识分子分型(CMS) 将结直肠癌分为四个亚型,其中CMS4(间质型) 具有激活TGF-β信号通路、上皮-间充质转化(EMT)、大量肿瘤相关成纤维细胞(CAF)浸润及高血管生成 等特征,临床表现为易发生早期转移、对化疗和免疫治疗耐药、预后极差 。然而,目前CMS4的检测主要依赖术后肿瘤组织的免疫组化或转录组测序 ,无法在术前无创获取,且存在成本高、取材有限、无法反映肿瘤整体异质性等局限。因此,临床急需一种术前、无创、低成本且可重复的CMS4识别工具 。影像组学能从常规MRI图像中提取大量定量特征,反映肿瘤的微观血管状态和结构异质性 ,而这恰好与CMS4的两大核心生物学特征------血管生成(反映于增强T1WI)和间质异质性(反映于T2WI) 高度契合。因此,研究者提出科学假设:多参数MRI影像组学特征能够捕捉CMS4的"生物学印迹",从而实现术前无创预测,并为后续机制验证奠定基础。
03
研究目的(明确写出"三层目的")
本研究的第一层目的(技术层) 是:基于术前多参数MRI(包括增强T1WI和T2WI) ,构建一个机器学习影像组学模型 ,生成一个连续性的影像组学CMS4评分(MRC4s) ,用于无创预测结直肠癌患者的CMS4状态 ,并与多种深度学习模型(ResNet50、VGG16、DenseNet201)进行性能比较。第二层目的(临床层) 是:评估MRC4s是否能够独立预测患者的无病生存期(DFS) ,并对复发转移风险进行有效分层 ;同时探索其在新辅助化疗反应预测 中的潜在价值。第三层目的(生物学层) 是:利用批量RNA测序(bulk RNA-seq)和公共单细胞RNA测序(scRNA-seq)数据 ,揭示MRC4s与CMS4相关生物学通路(TGF-β、EMT、血管生成) 及CAF亚型(尤其是myofibroblastic CAF) 之间的关联,从而为影像组学特征提供生物学可解释性,验证其"从影像表型到分子机制"的桥接能力。
04
研究思路(最核心:怎么挂靠机制)
本研究的核心思路是**"影像特征 →模型评分 → SHAP解释 → 多组学机制验证"** 的递进链条。首先,研究者从增强T1WI和T2WI 中提取影像组学特征,采用高斯过程分类器 分别构建两个序列特异性评分,再通过逻辑回归融合 得到合并MRC4s。接着,使用SHAP分析 识别对CMS4预测贡献最大的关键特征(如增强异质性、纹理不均匀性),初步建立影像特征与生物学表型之间的定性联系。然后,研究者引入bulk RNA-seq数据 ,根据MRC4s高低分组进行差异表达基因分析和GSEA通路富集分析 ,验证高MRC4s组是否显著富集TGF-β、EMT、血管生成 等CMS4特征通路。进一步,通过基因集变异分析(GSVA) 和Spearman相关分析 ,量化MRC4s与多种CAF特征集(如myCAF、ECM myCAF) 的相关性。最关键的一步是:利用公共单细胞RNA-seq数据 ,将差异表达基因映射到八种主要细胞类型和八种CAF亚型 ,发现差异基因最显著富集于myofibroblastic CAF 亚群,从而将影像组学评分直接锚定到特定的细胞亚型 上。最后,通过肿瘤纯度评分和基质评分 ,从细胞组成层面验证CMS4的"高间质、低纯度"特征。这一思路实现了从影像表型 → 分子通路 → 细胞亚群的逐层解构,是影像组学"可解释性"和"生物学挂靠"的范例。
05
数据和方法(机制部分怎么设计)
数据: 本研究共纳入253例 结直肠癌患者(中位年龄63岁,男163例),来自三个医疗中心。中心1的168例 按8:2随机分为训练集(136例) 和内部测试集(32例) ,中心2和中心3的85例 作为外部测试集 。另从中心1收集18例 具bulk RNA‑seq数据的患者作为生物学子集 ,用于通路及CAF特征分析;公共单细胞RNA‑seq数据(GSE132465、GSE144735,35例 )用于细胞亚型验证 。44例 接受新辅助治疗的患者构成探索性亚组,用于治疗反应分析。

图 1:数据收集流程图
方法:图像预处理 (强度归一化、体素重采样)→ 肿瘤分割 (两位放射科医师独立勾画T2WI和CE‑T1WI全肿瘤容积,高年资医师审核)→ 特征提取 (PyRadiomics提取影像组学特征)→ 特征选择与模型构建 (高斯过程分类器 ,五折交叉验证,分别训练CE‑T1WI和T2WI模型,生成序列特异性MRC4s )→ 模型融合 (逻辑回归 合并两个评分得到合并MRC4s )→ 性能评估 (AUC、灵敏度、特异度,与ResNet50/VGG16/DenseNet201比较)→ 可解释性分析 (SHAP值 、净重分类改进指数)→ 预后分析 (Kaplan‑Meier和Cox回归评估无病生存期)→ 生物学验证 (bulk RNA‑seq差异表达分析 、GSEA通路富集 、GSVA计算CAF/TME特征相关性;scRNA‑seq细胞类型和CAF亚型映射)。

图 2:研究整体工作流程图
06
研究结果("从表型到机制")
①模型表现 :合并MRC4s在内部测试集中AUC达0.85 ,外部测试集中AUC为0.84 ,显著优于ResNet50等深度学习模型(AUC范围0.70--0.75)。CE‑T1WI模型(AUC 0.77--0.88)略优于T2WI模型(AUC 0.73--0.83),双序列融合进一步提升预测性能。

图 3(模型性能评估): 该图包含A‑F六个子图,分别展示训练集、内部测试集、外部测试集中的ROC曲线 (A‑C)及对应的花状多指标玫瑰图 (D‑F)。CE‑T1WI(红色)、T2WI(蓝色)和合并模型(紫色)均表现出良好区分度,其中合并模型在外部测试集中AUC达0.84 。玫瑰图综合展示了准确率、灵敏度、特异度、阳性预测值等指标的一致性。这些结果表明,双序列融合能更全面捕捉CMS4的血管生成与间质异质性,优于单序列或深度学习方法。
②临床预后 :合并MRC4s是无病生存期的独立预测因子 (HR=5.96)。高MRC4s组复发转移风险显著升高,Kaplan‑Meier曲线分层明显。多因素分析还显示粘蛋白含量、淋巴血管侵犯和神经侵犯亦为独立预后因素。

图 4(生存分析曲线): 该图展示了基于免疫组化方法 (A)与合并MRC4s评分 (B)分层的Kaplan‑Meier生存曲线。两种方法均显示:CMS4患者的无病生存期显著劣于非CMS4患者 。特别地,MRC4s评分分层的风险比高达5.96 ,远高于免疫组化法的2.24,表明影像组学评分具有更强的预后区分能力。这一结果将影像组学特征直接与临床结局(复发/转移风险)锚定,为MRC4s的临床实用性提供了有力证据,也间接验证了其背后的侵袭性生物学行为。
③生物学验证 :差异表达基因显著富集于TGF‑β、EMT、血管生成 通路。MRC4s与myofibroblastic CAF 特征高度相关(R=0.637--0.676)。单细胞测序证实差异基因主要定位于成纤维细胞 ,尤其是myCAF亚型,且CMS4组呈现高基质评分、低肿瘤纯度。

图 5(生物学机制验证): 该图是影像组学挂靠机制的核心 。A‑B (热图、火山图)显示CMS4与非CMS4间存在1220个差异表达基因;C (GSEA)证实TGF‑β、EMT、血管生成 通路显著富集;D (点图)显示MRC4s与myCAF、ECM myCAF 等CAF特征高度相关(R>0.63);E‑H (t‑SNE及小提琴图)将差异基因定位至成纤维细胞 ,进一步锁定到myofibroblastic CAF亚型 。该图完整构建了"影像评分 → 分子通路 → 细胞亚型"的证据链,实现影像组学的生物学可解释性。

图 6(临床应用示例): 该图通过两名代表性患者展示MRC4s的临床判读流程。患者A (74岁,CMS4阳性):CE‑T1WI呈异质性强化,T2WI信号不均匀,概率图显示高贡献区域 ,MRC4s=0.64;患者B (60岁,非CMS4):增强较均匀,T2WI信号相对一致,概率图低贡献,MRC4s=0.004。下方的HE及CD31免疫组化证实:患者A具有更高的微血管密度和肿瘤‑间质比 。该图直观展示了影像特征(异质性/强化模式)如何反映微观血管和间质生物学,为模型提供了可视化的临床落地场景。
07
讨论(把机制故事讲圆)
本研究提出并验证了一个基于多参数MRI影像组学 的机器学习模型(MRC4s),能够术前无创预测结直肠癌CMS4亚型 ,并在内部和外部测试集中均表现出良好性能。更重要的是,研究通过批量RNA测序和单细胞RNA测序 ,首次系统揭示了影像组学评分与CMS4核心生物学特征之间的因果性关联 。具体而言,高MRC4s显著富集TGF-β信号通路、上皮-间充质转化(EMT)和血管生成 通路,且与肿瘤相关成纤维细胞(CAF) ------尤其是myofibroblastic CAF(myCAF) ------的浸润程度高度相关。这一发现解释了为何CMS4患者易转移、耐药且预后差:myCAF通过分泌TGF-β重塑细胞外基质、诱导EMT并促进血管生成。从影像角度,CE-T1WI的异质性增强 反映了CMS4的高血管生成活性,而T2WI的纹理不均 则捕捉了间质和细胞异质性,两者融合模型表现最佳,体现了多参数互补 的价值。SHAP分析进一步佐证:贡献最大的特征正是与异质性和增强模式 相关的组学特征,这说明模型并非"黑箱",而是直接映射了生物学过程。尽管研究存在回顾性设计、样本量有限、多中心扫描参数差异等局限,但其**"影像表型 → 分子通路 → 单细胞亚型"** 的验证链条,为影像组学的生物学可解释性 树立了范例。此外,MRC4s能独立预测无病生存期(HR=5.96) ,并提示新辅助化疗反应较差,具有直接的临床转化潜力。未来需前瞻性、大样本、多中心研究,并探索将MRC4s与FAPI-PET等新技术结合,以进一步完善CMS4患者的精准管理策略。
08
这篇文献的可借鉴思路
本论文为影像组学研究如何挂靠生物学机制 提供了极佳的范式,以下几个方面尤其值得借鉴。第一,选题策略 :选择具有明确且可影像化生物学特征 的分子亚型(CMS4的CAF/TGF-β/EMT/血管生成轴),使影像组学特征天然具备"生物印迹",而非盲目寻找关联。第二,多参数设计 :CE-T1WI对应血管生成 ,T2WI对应结构异质性 ,双序列融合既提高了预测性能,又为后续机制解释提供了"分工明确"的影像证据。第三,可解释性前置 :不仅报告AUC,还使用SHAP分析 展示哪些具体特征(如一阶偏度、灰度共生矩阵相关性)最重要,并赋予其生物学含义(如异质性、增强不均匀性)。第四,多组学验证链条 :bulk RNA-seq(通路)→ GSVA(特征集)→ scRNA-seq(细胞亚型) ,逐层深入,从分子功能到细胞来源,构建了完整的生物学证据链。第五,单细胞数据锚定 :将影像评分与特定CAF亚型(myCAF) 直接关联,这是目前影像组学机制验证中较为稀缺且高级的做法,远优于仅报告通路富集。第六,临床预后衔接 :将影像评分与无病生存期、化疗反应 挂钩,增强临床价值。总体而言,这套**"从临床需求出发 → 多参数影像建模 → SHAP解释 → 多组学逐级验证 → 临床预后锚定"**的研究框架,可广泛应用于其他分子分型、治疗反应预测及肿瘤微环境评估等影像组学研究。
09
结语
这篇文章真正高级的地方,并不在于"AUC达到0.84",而在于它成功回答了影像组学领域最关键的问题之一:为什么影像能够预测分子亚型? 作者最终证明,MRI中的强化异质性与纹理异质性,并不是抽象的数学特征,而是CAF富集、ECM重塑、血管生成以及TGF-β/EMT激活在影像层面的可视化映射。换句话说,影像组学真正捕获的,并非单纯的"肿瘤形态",而是肿瘤微环境的生物学状态。这也是为什么这篇文章能够突破传统"相关性研究"的局限,进入真正具有生物学解释力的层面。更重要的是,它提供了一套非常值得借鉴的顶刊研究路径:从临床问题出发,以机制假说驱动序列设计,再通过转录组、单细胞与微环境分析完成跨层级验证,最终形成"影像---机制---临床"闭环。 未来真正高水平的影像组学研究,可能不再局限于预测分期、分类或预后,而会进一步发展为对CAF、免疫、缺氧、EMT、血管生成等肿瘤生态系统的无创感知。也就是说,影像组学未来最重要的价值,或许并不是替代病理,而是成为一种能够动态解析肿瘤微环境的"空间生物学工具"。
参考文献:Liu Z, Gu W, Liu L, Wu S, Yao Z, Sun Y, Huang D, Tong T. Interpretable MRI-based Multiparametric Radiomics for Preoperative Prediction of CMS4 Colorectal Cancer. Radiology. 2026 May;319(2):e251719. doi: 10.1148/radiol.251719.