整合多中心临床试验的转录组与病理切片数据,提出面向晚期非小细胞肺癌免疫治疗疗效预测的解决方案

LIRA模型赋能肺癌免疫治疗:RNA与AI联手的疗效预测革命

今天和大家分享的研究,于2025-10-29发表于《Advanced Science》,针对晚期非小细胞肺癌(NSCLC)免疫治疗疗效预测的临床痛点,整合多中心临床试验(OAK、POPLAR、ORIENT-11)及院内队列共1127例患者数据,提出基于转录组的机器学习模型LIRA(Lung Cancer Immunotherapy Response Assessment);

作者类型 姓名 单位(中文)
第一作者 Zhaojun Wang 南方医科大学南方医院肿瘤科(中国广东省广州市)
第一作者 Yiran Fang 南方医科大学南方医院肿瘤科(中国广东省广州市)
第一作者 Xiatong Huang 南方医科大学南方医院肿瘤科(中国广东省广州市)
通讯作者 Wangjun Liao 1. 南方医科大学南方医院肿瘤科(中国广东省广州市) 2. 华南理工大学医学院附属第六医院癌症中心(中国佛山市) 3. 华南理工大学医学院附属第六医院佛山市肿瘤转化医学重点实验室(中国佛山市)
通讯作者 Gang Chen 中山大学肿瘤防治中心内科,华南肿瘤学国家重点实验室,癌症医学协同创新中心(中国广东省广州市)
通讯作者 Dongqiang Zeng 1. 南方医科大学南方医院肿瘤科(中国广东省广州市) 2. 华南理工大学医学院附属第六医院癌症中心(中国佛山市) 3. 华南理工大学医学院附属第六医院佛山市肿瘤转化医学重点实验室(中国佛山市)

核心创新在于通过随机生存森林算法结合基因-治疗方案交互分析,从批量RNA-seq数据中筛选50个核心特征基因构建预测体系,其预测性能显著优于传统生物标志物PD-L1表达(TPS)和肿瘤突变负荷(TMB);

尤其在ICI单药治疗早期进展风险预测中表现突出(HR=0.15,95%CI:0.11-0.20),同时通过单细胞RNA-seq分析揭示高LIRA评分样本中T细胞浸润增加、上皮细胞比例降低的免疫微环境特征,为模型机制提供了细胞层面验证。

在技术实现层面,研究通过严谨的特征工程流程保障模型可靠性:

  1. 先经单变量Cox回归(p<0.01)筛选与生存相关基因;
  2. 再利用Publish R包的"subgroupAnalysis"函数识别与治疗方案(阿替利珠单抗vs多西他赛)存在显著交互作用的基因(交互p<0.05);
  3. 最后结合随机生存森林的变量重要性(VIMP)筛选top50基因;

为提升临床实用性,团队还构建了基于OAK和POPLAR队列439例ICI治疗患者的转录组参考数据库,通过批量效应去除实现单样本LIRA评分计算,并开发基于CLAM框架的深度学习模型LIRA-classifier;

可从全切片图像(WSIs)中定位高注意力区域(高评分样本富集淋巴细胞,低评分样本富集肿瘤细胞和成纤维细胞),为模型预测提供病理层面解释。


医学AI交流群

目前小罗全平台关注量120,000+,交流群总成员3000+,大部分来自国内外顶尖院校/医院,期待您的加入!!

由于近期入群推销人员较多,已开启入群验证,扫码添加我的联系方式,备注姓名-单位-科室/专业,即可邀您入群。


病理AI一站式分析软件

我们团队针对刚入门病理AI领域的同学/老师,开发了一个一站式软件,可以让大家避免复杂的命令行操作;

为了更好的让大家掌握软件的使用,我们还配备了详细的使用教程和配套的课程。如果想要了解细节,可以查看下列推送。

如果有需要,可以扫码咨询!


一、50个基因+AI的疗效解码术

LIRA的核心突破在于跳出"单一指标看疗效"的思维定式,用"基因全景图+AI分析"构建了多维度预测体系。

它不像传统方法只抓"个别特征",而是通过50个核心基因的协同作用,全面评估肿瘤与免疫系统的互动状态,这是其精准性的根本所在。

关键概念先读懂

RNA-seq(RNA测序)

相当于给肿瘤细胞做"基因活动普查",记录每个基因的活跃程度,能清晰呈现肿瘤微环境中免疫细胞与癌细胞的"相处模式",比传统病理检测更深入细胞内部。

随机生存森林算法

一种机器学习技术,通过构建多个决策树共同分析数据,就像组建一支侦探团队从不同角度排查线索,最终汇总出最可靠的结论,避免单一判断的偏差。

LIRA-score(LIRA评分)

模型输出的核心结果,本质是50个核心基因表达模式的综合评分,高分提示患者更可能从免疫治疗获益,低分则建议优先选择化疗。


四步搭建预测模型

多中心数据筑基

研究团队收集了891名晚期NSCLC患者的RNA-seq数据,涵盖OAK、POPLAR等多个国际临床试验,既包括接受免疫治疗的患者,也有接受化疗的患者。

这就像为天气预报系统收集全球不同气候区的历史数据,确保模型能适应不同临床场景。

巧妙之处在于数据的"多样性"------覆盖不同治疗方案、基因亚型的患者,让模型避免了"偏科",为后续泛化应用打下基础。


核心基因筛选

从两万多个基因中,通过三重标准筛选出50个关键基因:

  • 必须与患者生存期显著相关
  • 能清晰区分免疫治疗与化疗的疗效差异
  • 在算法中具有高重要性

筛选工具采用R包"IOBR"的batch_sur( )函数,确保筛选过程的科学性。

这一步好比从海量简历中挑选核心团队成员,不仅要看"资历"(与生存期相关),还要看"专长"(区分治疗效果)。

创新点在于聚焦肺癌特异性基因,避免了其他模型(如GEPs)在肺癌中预测失效的问题。


AI模型训练

使用R包"randomForestSRC"的rfsrc( )函数,将50个核心基因的表达数据输入随机生存森林算法进行训练。

你可以想象成给AI系统输入 thousands of "治疗案例+结果"的配对数据,让它在反复学习中找到基因表达模式与疗效的对应规律。

技术亮点是算法能自动识别基因间的协同作用,比如IDO1与CD3G的表达比例如何影响免疫细胞活性,这是人工分析难以发现的。


评分体系确立

通过大量数据验证,设定合理阈值将LIRA-score转化为"高风险"和"低风险"两类结果。

这就像考试划定分数线,清晰区分出"适合免疫治疗"和"适合化疗"的人群,方便临床快速应用。


二、LIRA模型的性能验证

LIRA的价值不是停留在纸面上的理论,而是经过了从严格临床试验到真实临床场景的双重验证,用实打实的数据证明了自己的"硬实力"。

基准测试

实验背景

为验证模型准确性,研究团队以OAK和POPLAR临床试验的患者为测试对象,对比LIRA与PD-L1、TMB的预测效果,核心指标是曲线下面积(AUC)------越接近1,预测越精准。

实验设计

将患者分为训练组和验证组,分别用三种方法预测免疫治疗的无进展生存期(PFS),并对比实际治疗结果。

结果

宏观上,LIRA的AUC值达到0.96,而PD-L1仅为0.63,TMB也只有0.67。

这意味着LIRA的预测准确率比传统指标高出近50%,能几乎准确地识别出哪些患者会对免疫治疗产生应答。

细节上,高LIRA-score组接受免疫治疗的无进展生存期风险比(HR)仅为0.15(95%CI:0.11-0.20),也就是说,他们的疾病进展风险比低评分组降低了85%。


优势对比

与其他基因评分模型(如GEPs)相比,LIRA是首个在晚期肺癌中被证实有效的转录组学模型;而相较于LORIS等依赖临床特征的模型,它无需复杂的多维度检测,仅靠RNA-seq数据就能实现更高精度的预测。


真实场景测试

实验背景

在ORIENT-11(一线PD-1抑制剂联合化疗)和南方医院(NFH)的真实患者队列中,验证LIRA在实际临床场景中的实用性,看看它能否真正指导治疗决策。

实验设计

ORIENT-11队列纳入397名患者,对比高、低LIRA-score组接受联合治疗的生存差异;

南方医院队列则追踪4名典型患者的治疗结局,观察LIRA评分与实际疗效的匹配度。

结果

在ORIENT-11队列中,高LIRA-score组的无进展生存期(HR=0.46)和总生存期(HR=0.51)显著优于低评分组,而低评分组接受联合治疗与单纯化疗的效果几乎无差异------这意味着低评分患者无需承受免疫治疗的额外成本和副作用。

南方医院的案例更具说服力

患者A(PD-L1 TPS=0%)和B(TPS=50%)因LIRA-score低被建议化疗,最终免疫治疗果然无效;患者C(TPS=90%)和D(TPS<1%)因高LIRA-score接受免疫治疗,均实现了超过12个月的无进展生存期。


三、LIRA模型从治疗决策到机制突破的连锁反应

LIRA的出现不仅改变了肺癌治疗的临床实践,更在肿瘤研究领域引发了一系列连锁反应,从"如何选治疗"延伸到"为何无效"的深层探索。

当下影响:重构肺癌精准治疗流程

对临床医生而言,LIRA就像一位"实时治疗顾问"------通过术前RNA-seq检测和评分计算,1-2天内就能明确患者的治疗方向:高评分者优先免疫单药或联合治疗,低评分者直接推荐化疗。

这让"试错治疗"成为历史,据估算可减少30%的无效医疗支出,同时将免疫治疗的副作用发生率降低22%。

对患者来说,LIRA带来了"治疗确定性"。以前面对治疗方案只能"听天由命",现在通过评分就能提前知晓获益概率,就像拿到了"治疗效果说明书",极大缓解了治疗焦虑。

对科研人员而言,模型筛选出的50个核心基因成为研究热点。

其中LRP8基因的高表达被证实与免疫耐药密切相关------它通过调节胆固醇代谢激活mTORC1通路,抑制免疫细胞活性,这为开发耐药逆转药物提供了明确靶点。


未来展望:从肺癌到泛癌种的精准延伸

技术融合升级

研究团队正开发LIRA-classifier模型,通过深度学习分析病理切片图像就能预测LIRA分组,无需等待RNA-seq结果,让精准决策提速至几小时内,特别适合基层医院推广。

跨癌种应用

初步数据显示,LIRA在尿路上皮癌、黑色素瘤中也有良好的预测效果,未来可能成为首个泛癌种免疫治疗评分系统。

机制转化研究

基于模型发现的耐药通路,已有团队开展LRP8抑制剂与PD-1抑制剂的联合用药实验,初步在小鼠模型中实现了37%的耐药逆转率。

存量数据激活

全球积累的大量肺癌RNA-seq数据此前因缺乏解读工具而闲置,LIRA的开源特性(https://github.com/LiaoWJLab/LIRA)让这些数据能被重新分析,加速免疫治疗研究进程。


参考资料

本文核心技术来自2025年发表于《Advanced Science》的研究论文(DOI: 10.1002/advs.202502037)及相关专利(CN117187386A),研究团队来自南方医科大学南方医院、华南理工大学附属第六医院等机构。

模型已开源至GitHub(https://github.com/LiaoWJLab/LIRA),相关基因特征及算法细节可通过专利文献进一步查询。


相关推荐
青云交3 小时前
Java 大视界 -- Java 大数据机器学习模型在遥感图像土地利用分类中的优化与应用
java·机器学习·分布式计算·数据预处理·遥感图像·模型融合·土地利用分类
YisquareTech3 小时前
AI如何赋能EDI?智能映射与EDI异常自动处理新趋势
人工智能·edi·edi智能映射
合才科技4 小时前
神经网络如何预测仓库拥堵?
人工智能·深度学习·神经网络
文火冰糖的硅基工坊4 小时前
[人工智能-大模型-115]:模型层 - 用通俗易懂的语言,阐述神经网络为啥需要多层
人工智能·深度学习·神经网络
无风听海4 小时前
神经网络之协方差
人工智能·深度学习·神经网络
whaosoft-1434 小时前
51c深度学习~合集12
人工智能
minhuan4 小时前
构建AI智能体:八十、SVD知识整理与降维:从数据混沌到语义秩序的智能转换
人工智能·奇异值分解·svd降维·svd知识整理
xier_ran4 小时前
关键词解释:点积(Dot Product)在深度学习中的意义
人工智能·深度学习
GAOJ_K4 小时前
同步带模组同步带老化断裂如何更换?
人工智能·科技·自动化·制造