01
文献学习


今天分享的文献是由山西医科大学第一医院核磁影像科王效春教授等团队于2026年4月4日在《European Radiology》(中科院2区,IF=4.7)上发表的研究"Application of transformer-enhanced convolutional neural network: multicenter MRI assessment of muscle invasion in bladder cancer"即基于Transformer增强型卷积神经网络的多中心MRI评估膀胱癌肌层浸润,该研究旨在解决膀胱癌MRI评估中存在的"形态相关诊断偏倚"(即有蒂 vs. 无蒂病变)。研究团队开发了一种基于ConvNeXt-tiny架构的2.5D深度学习模型,用于评估膀胱癌是否侵犯肌层,并与放射科医生(初级和高级)的诊断表现进行对比。结果表明,该模型在无蒂病变中显著减少了过度分期,表现出与病变形态无关的稳定诊断性能。
创新点:①融合Transformer理念的ConvNeXt :通过大核卷积、层归一化等设计,增强全局上下文建模,无需手工特征即可提升分期准确性。②揭示形态学诊断偏倚 :首次证实放射科医生对无蒂病变 存在过度分期(特异性显著下降),而模型无此偏倚。③高效2.5D框架与可解释性:采用2.5D输入和类激活映射,兼顾计算效率与决策逻辑可视化,优于传统3D模型。
临床价值:①减少无蒂病变过度治疗 :模型特异性达91.9-96.0%,避免将非肌层浸润误判为肌层浸润,降低不必要根治手术。②提供形态无关的客观评估 :不受肿瘤带蒂/无蒂形态干扰,为VI-RADS评分提供补充,尤其适用于疑难病例。③多中心前瞻性验证高灵敏度:在90%特异性下灵敏度达84-89%,优于放射科医生,提升早期检测可靠性。

图 2:研究整体工作流程图
A(nnU-Net 分割网络):展示编码器-解码器架构,包含3D卷积层、InstanceNorm、LeakyReLU和跳跃连接。用于自动分割T2WI上的肿瘤区域。
B(2.5D 分类框架):以肿瘤最大面积切片为中心,取前后各3层共7层切片,用滑动窗口(步长1,循环边界)生成7个三通道堆栈,沿batch维度拼接后输入网络。
C(ConvNeXt‑tiny 骨干网络):包含4个阶段(分别有3、3、9、3个ConvNeXt块),每个块采用逆瓶颈设计、LayerNorm、GELU激活和1×1卷积组成的MLP。下采样通过2×2卷积实现,最后通过全局池化和全连接层输出分类概率。
02
研究背景和目的
研究背景
膀胱癌是全球第九大常见恶性肿瘤,其治疗决策的核心依据是肿瘤是否侵犯肌层 :非肌层浸润性膀胱癌(NMIBC)预后较好,通常采用经尿道切除术;而肌层浸润性膀胱癌(MIBC)预后较差,需行根治性切除联合放化疗。MRI 是目前评估肌层浸润最重要的无创影像方法,尤其是T2加权像可清晰显示肿瘤与膀胱壁的关系。然而,常规MRI评估存在明显的形态相关诊断偏倚 :临床经验认为"有蒂"病变的肌层浸润风险低,"无蒂"病变风险高,这种固定思维模式可能导致放射科医生在解读图像时产生锚定偏倚和确认偏倚,从而对无蒂病变过度分期 (假阳性)。尽管VI-RADS评分系统提高了诊断一致性,但其评分标准中明确将"蒂"作为低分(1-2分)的关键特征,可能反而强化了这一偏倚。近年出现的深度学习模型(如ResNet、Inception V3)虽在预测肌层浸润方面展现出潜力,但它们作为传统卷积神经网络(CNN),全局上下文建模能力有限,往往需要依赖手工提取的影像组学特征来提升性能。ConvNeXt是一种融合了Transformer设计理念(大核卷积、层归一化、GELU激活)的现代化CNN,能够在保持卷积计算效率的同时增强全局上下文建模。因此,探索该模型能否克服形态相关的诊断偏倚具有重要的临床价值。
研究目的
本研究旨在开发并验证一个基于ConvNeXt的增强型卷积神经网络 (Transformer-enhanced CNN),用于术前通过多中心MRI 评估膀胱癌的肌层浸润状态,并重点检验该模型是否能够独立于肿瘤形态(有蒂 vs. 无蒂) 实现准确诊断,从而克服传统影像评估中存在的形态相关诊断偏倚。具体目标包括:第一,利用nnU-Net辅助肿瘤分割,构建2.5D 分类框架处理T2加权图像,并对比ConvNeXt-tiny与ResNet50、DenseNet169、Inception V3等传统CNN的性能;第二,在回顾性训练/验证集和三个前瞻性测试集(内部及两个外部中心)中,系统比较模型与高年资(10年经验)和低年资(5年经验)放射科医生 的诊断效能(AUC、准确率、敏感度、特异度),尤其针对无蒂病变的特异性进行亚组分析;第三,通过**类激活映射(CAM)**可视化解释模型的决策逻辑,并采用决策曲线分析评估其临床净获益。研究假设:模型不受形态偏倚影响,在无蒂病变中能显著提高特异性(减少过度分期),从而为临床提供更可靠的辅助决策工具,尤其适用于易被误判的无蒂病变。
03
数据和方法
研究数据
总样本量:1374例膀胱尿路上皮癌患者,来自三个中心。
数据划分:
训练集:487例(中心A,回顾性,2018-2022)
验证集:121例
内部测试集:490例(中心A,前瞻性,2022-2024)
外部测试集1:181例(中心B)
外部测试集2:95例(中心C)
排除标准:最大直径 < 5mm的微小病变

图 1:患者筛选流程图
技术方法
图像分割:使用nnU-Net辅助分割T2加权图像中的肿瘤区域。
模型架构:ConvNeXt-tiny,2.5D框架(7层切片堆叠,滑动窗口输入)。
训练策略:Asymmetric Loss、AdamW优化器、CyclicLR调度。
对比模型:ResNet50、DenseNet169、Inception V3。
评估指标:AUC、准确率、灵敏度、特异性。
统计方法:Delong检验、Z检验、Fisher精确检验、FDR校正。
04
实验结果
模型性能:
验证集及三个测试集AUC为0.915--0.925,准确率84.9--91.0%。
显著优于传统CNN模型。
形态偏倚分析:
模型在有无蒂病变之间无显著性能差异。
放射科医生在无蒂病变中特异性显著下降(从~90%降至~75%)。
头对头比较:
在无蒂病变中,模型特异性(91.9--96.0%)显著高于医生(72.8--79.8%)。
在内部测试集中,模型AUC(0.921)显著高于高级(0.876)和初级(0.867)医生。

图 3:放射科医生诊断性能的雷达图

图 4:在90%特异性下的灵敏度比较(条形图,文本推断)

图 5:Grad-CAM 可视化对比

图 6:与蒂相关的诊断偏倚代表性病例
05
研究结论
该研究证明膀胱癌肌层浸润的MRI评估存在与肿瘤形态相关的诊断偏倚 ,主要表现为放射科医生对无蒂(sessile)病变的特异性显著下降 (从带蒂病变的约90%降至75%左右),即倾向于过度诊断为肌层浸润性膀胱癌。相比之下,基于ConvNeXt‑tiny架构的深度学习模型 在带蒂与无蒂病变间的诊断性能无显著差异,有效克服了形态依赖的偏倚。头对头比较显示,在无蒂病变中,模型的特异性(91.9%--96.0%)显著高于高级和初级放射科医生(72.8%--79.8%) ,且AUC、灵敏度等指标整体更优。模型在内部及外部测试集中均表现稳定(AUC 0.915--0.925),并具有良好的校准度和临床净收益。类激活映射进一步揭示了模型对肿瘤及膀胱壁区域的全局上下文建模能力,为其可解释性提供了直观证据。综上,该深度学习模型能够独立于肿瘤形态评估肌层浸润状态,尤其可减少对无蒂病变的过度诊断,有望作为临床辅助工具提升MRI评估的准确性。
参考文献:Fan Z, Li D, Chen W, Li Y, Guo J, Zheng W, Wang B, Wang Y, Wang X. Application of transformer-enhanced convolutional neural network: multicenter MRI assessment of muscle invasion in bladder cancer. Eur Radiol. 2026 Apr 4. doi: 10.1007/s00330-026-12497-5.