【文献分享】DrugFormer:一种基于图结构增强的语言模型,用于预测药物敏感性

文章目录

介绍

药物耐药性在医疗领域构成了一项重大挑战,化疗和靶向治疗的疗效响应率仍然较低。肿瘤细胞的复杂异质性加剧了个体患者的耐药性,这给有效的治疗带来了巨大障碍。为应对这一挑战,提出了一种名为"DrugFormer"的新型图增强大型语言模型,旨在以单细胞水平预测药物耐药性。DrugFormer 将序列化的基因标记和基于基因的知识图谱相结合,以实现对药物反应的准确预测。在包含药物反应信息的全面单细胞数据上进行训练后,DrugFormer 模型表现出卓越的性能,在预测药物反应方面具有更高的 F1 值、准确率和召回率。基于难治性多发性骨髓瘤(MM)和急性髓系白血病(AML)患者的 scRNA-seq 数据,DrugFormer 在识别耐药细胞和揭示潜在分子机制方面显示出很高的有效性。通过伪时间轨迹分析,揭示了与患者不良预后相关的独特耐药细胞状态。此外,DrugFormer 能够识别出诸如 COX8A 等潜在的治疗靶点,从而在不同癌症类型中克服药物耐药性。总之,DrugFormer 在药物耐药性预测领域实现了重大突破,为揭示细胞对药物的反应的异质性以及指导个性化治疗策略提供了一种强大的工具。

药物耐药性在医疗领域是一个重大挑战,这一点在临床研究中所观察到的令人担忧的治疗反应率中得到了充分体现。对 570 项 II 期单药临床试验的荟萃分析显示,化疗的中位治疗反应率仅为 11.9%,而在个性化靶向治疗的情况下,这一比率仅为 30%。尽管在解决治疗效果的患者间差异方面一直在努力,但对导致药物耐药的患者内差异的关注却非常有限。例如,肿瘤内的异质性指的是肿瘤内癌细胞的多样性,这些癌细胞可能具有不同的基因、表观遗传和表型特征。这种异质性给癌症治疗带来了挑战,因为不同类型的癌细胞对药物的反应可能不同,从而导致治疗耐受和肿瘤复发。因此,有必要探究耐药癌细胞的多样性,并确定导致患者层面耐药的特定细胞亚群。

随着技术的迅速发展,单细胞 RNA 测序(scRNA-seq)已成为一项革命性的技术,它能够在细胞和细胞类型层面为研究肿瘤细胞的耐药性提供高分辨率的分析手段。[3-12] scRNA-seq 已被用于揭示耐药机制,从而发现了有效的靶点,并开发出了优化的治疗策略。例如,Heo 等人分析了 scRNA-seq 数据,并确定了胞嘧啶脱氨酶为潜在的可用药靶点,以消除肺癌中的耐药细胞。[13] Li 等人揭示了一个处于静止状态的类似干细胞的细胞亚群,该亚群导致了急性髓系白血病(AML)的化疗耐药性和不良预后。[14] 这些先进的技术和所生成的数据资源已被汇集在广泛的数据集中,例如 DRMref 数据库,[15] 它作为人类癌症中耐药机制的综合参考图谱,为对耐药性的深入分析提供了宝贵的资源。

要深入探究个体患者的药物耐药性,关键在于开发出针对性的方法来探究复杂组织中的细胞如何对药物产生不同的反应。然而,目前缺乏专门为此目的设计的先进模型。尽管有一些研究,如 DREEP[16]、scDEAL[17]、SCAD[18] 等,利用了现有的药物筛选数据库[19, 20] 来从单细胞层面研究药物反应,但这些研究存在显著的局限性。首先,它们依赖于基于细胞系的知识作为参考,缺乏体内特性,也无法模拟真实的体内环境,这可能导致对组织样本中的细胞预测准确性不佳。其次,它们的预测仅限于药物筛选数据库中现有的某些药物或化合物,缺乏对实际应用药物的泛化能力来预测细胞对药物的反应。为了解决这些局限性,大型语言模型(LLMs)已成为揭示细胞对药物反应的有前景的解决方案。鉴于已为药物耐药性研究收集的现有单细胞 RNA 测序数据[15],先进的大型语言模型提供了一种定制化的解决方案,它不仅能整合来自大量体内数据资源的信息,还具备泛化能力,能够预测单细胞 RNA 测序数据中未知的细胞药物反应,从而有助于更全面地理解其机制。

自从 BERT 模型问世以来,预训练的大规模语言模型在自然语言处理以及生物信息学和生物医学领域的发展愈发成功。例如,OpenAI 的 GPT 系列和 Rostlab 的 ProtBert 都取得了巨大成功。同时,由于图能够从生物数据或外部知识库中表示复杂的关系和结构,通过融入图结构,图增强型 LLMs 能够利用这些复杂的关联,从而对数据有更丰富和更细致的理解。这使得 LLMs 能够更有效地获取和利用图信息或外部知识,从而提高其性能。这样的图增强型大型语言模型可以进一步优化,以实现更高的准确性、可控性和适应性,适用于各种任务和应用场景。在本研究中,我们提出了我们的 DrugFormer 模型,该模型利用大规模的药物耐药性数据库[15]来实现细胞水平药物耐药性的准确预测。这种前沿模型的主要目标是预测药物耐药性并揭示新的治疗靶点。

代码

https://github.com/QSong-github/DrugFormer

参考

相关推荐
handsomestWei2 小时前
LightRAG知识图谱使用和工作流集成
人工智能·知识图谱·rag·lightrag
云飞云共享云桌面2 小时前
研发部门使用SolidWorks和ug,cad,设计共享云桌面应该怎么选?
运维·服务器·网络·人工智能·3d
sali-tec2 小时前
C# 基于OpenCv的视觉工作流-章48-图像找荐
人工智能·opencv·计算机视觉
JoyCong19982 小时前
本地部署AI Agent正在被淘汰:ToClaw用云端+远程控制给出终局答案
人工智能·科技·电脑·远程操作
Ada's2 小时前
《相关研究》008:世界模型
人工智能
深念Y2 小时前
Harness Engineering:我的HomeSense Agent 架构演进
人工智能·算法·架构·智能家居·agent·小爱同学·harness
花千树-0102 小时前
基于 IndexTTS2 的数字人语音生成 Pipeline 设计
人工智能·aigc·ai编程·tts
阳艳讲ai2 小时前
AI 培训陪跑制造工厂 2026 前瞻:从人工生产到 AI 策略创作的智能转型全景图
人工智能
SCBAiotAigc2 小时前
2026.4.10:docker desktop内网环境安装教程
人工智能·docker·容器·具身智能