AIDD - 基于多层图注意力神经网络的药物-靶点相互作用预测模型研究

Nature | 基于多层图注意力神经网络的药物-靶点相互作用预测模型研究

引言

在药物研发过程中,准确预测**药物与靶点的相互作用(DTI)**对于确定化合物潜在治疗应用十分重要。传统的实验方法验证DTI,虽然可靠,但花费较多且耗时较长。

虽然现有神经网络的方法在 DTI 预测方面取得了重大进展,但它们在整合多源信息或处理药物-靶点相互作用的异质性方面经常出现问题。为此,作者提出了多层图注意力神经网络 (MLGANN) ,该网络不仅可以捕获了药物和靶点之间的多层次交互信息,还通过一种新颖的多层注意力机制整合了不同的数据源。最终,作者的实验结果表面,这种方法可以更全面、更准确地预测 DTI。

方法:MLGANN模型设计

2.1 多层DTI网络

MLGANN框架构建了一个多层网络,能够将来自药物和靶点的多源信息整合到一个统一的多层网络中。不像传统模型那样分别处理药物和靶点的关系,MLGANN将多种数据源(如化学结构、药物-疾病关系、副作用等)融合在一个网络中,这使得模型既能够表示药物和靶点的直接交互作用,也能够捕捉它们内部的相似性。

  1. 多源矩阵构建:每种药物和靶点都与多个矩阵关联,这些矩阵代表不同的交互和关系类型,例如化学相似性、药物-疾病联系和靶点-疾病关联。
  2. 图卷积网络(GCN)层:MLGANN的GCN层用于跨越不同网络层的交互,学习网络中节点的隐藏表示。
  3. 自注意力机制:模型使用自注意力机制来整合多源数据,按数据的重要性进行加权,以优化预测结果。

图 1.该图说明了一个多路复用层药物-靶点相互作用 (DTI) 网络,该网络跨多个层集成了来自药物 (D) 和靶点 (T) 的多级信息。左侧显示了不同层次的药物关联(标记为 AD、1、AD、2、AD、3),代表药物 D1、D2、D3 和 D4 之间的各种关系。在右侧,靶点关联以相似的层(AT,1 和 AT,2)描绘,靶点为 T1、T2 和 T3。该图的中央部分显示了药物和靶点之间的相互作用,其中多层网络结构用于捕获不同信息层之间的复杂相互作用。这种多层方法通过考虑层内和层间交互来实现更全面的 DTI 预测

MLGANN模型从网络的多个层级中聚合相邻节点的信息。每层表示一种特定的相似性或交互关系,这使模型既能从直接相邻节点(如具有相似化学结构的药物)中学习,也能从跨层关系(如共享副作用的药物)中学习。这种层次化的聚合方式增强了模型捕捉复杂交互关系的能力,使其优于单层网络。在生成最终的节点嵌入向量时,MLGANN使用多层注意力池化来加权聚合各层的信息,根据每个数据源在网络中的相关性进行调整。最终输出是每种药物和靶点的精细化表示,供DTI预测使用。

性能对比与分析

表1. 作者的模型与数据集 DTI 上的基线的比较。每次测量的最高和第二高结果分别以粗体和斜体显示。使用单侧配对 t 检验,与第二高的绩效相比,最佳模型表明 Pvalue 水平有显著改善。* 分别代表 1% 和 0.1% 的显著水平。

研究者基于DrugBank数据集进行对比实验,将MLGANN的表现与多种基线模型进行了比较,包括基于相似性、知识图谱和图神经网络(GNN)的模型。关键评价指标包括精度、召回率、F1得分、AUC(ROC曲线下面积)以及AUPR(精确率-召回率曲线下面积)。

  • 预测精度提升:由于MLGANN有效地利用了多源数据,在AUC和精度等指标上取得了显著的提升。
  • 消融实验:消融实验进一步验证了模型中各层的重要性,表明移除特定层(如药物-疾病相似性)会导致显著的性能下降。
  • 鲁棒性测试:通过随机移除部分训练数据来测试模型的鲁棒性,结果表明MLGANN在不同数据量下仍保持较高性能,并且在训练数据减少时表现出最小的性能衰减。

MLGANN模型对比传统方法的优势

MLGANN模型在多层结构和自注意力机制的加持下展现了超越传统DTI预测方法的显著优势。

区别于仅依赖化学结构或蛋白质序列的模型,MLGANN可以通过整合药物和靶点的多种信息,构建更为全面的潜在相互作用图景,从而能够捕捉更多关键数据。与同质模型不同,MLGANN的多层结构保留了药物-靶点交互的多样性,为更准确的预测提供了保证。MLGANN的设计灵活,可以进一步扩展以融入更多的数据源,使其具有很强的适应性,便于未来在DTI预测中的应用和拓展。

局限性与未来方向

尽管MLGANN在DTI预测中取得了显著进展,但仍然存在一些局限:

  1. 数据依赖性:模型的精度依赖于数据源的质量和完整性,数据缺失或不一致可能导致预测效果下降。
  2. 复杂性与计算成本:多层结构虽然有效,但需要大量计算资源,在计算能力受限的情况下可能限制其应用。

未来的研究可以进一步整合更多样化的生物数据源(如基因组和表观遗传信息)以提高预测的准确性。此外,优化模型的效率并将其应用于真实药物再利用情境,将为其在制药研究中的实际应用奠定基础。

结论

MLGANN在DTI预测领域的创新性是可以将GCN和注意力机制结合在一个多层框架中。MLGANN通过整合多种药物和靶点信息,实现了更准确和稳健的DTI预测,为加速药物发现和再利用提供了巨大潜力。MLGANN在解决现有模型局限的同时,为计算药理学的进一步创新铺平了道路,有助于开发新的治疗策略。

参考资料:Lu, Q., Zhou, Z. & Wang, Q. Multi-layer graph attention neural networks for accurate drug-target interaction mapping. Sci Rep 14, 26119 (2024). https://doi.org/10.1038/s41598-024-75742-1

相关推荐
@小匠4 小时前
Read Frog:一款开源的 AI 驱动浏览器语言学习扩展
人工智能·学习
山间小僧5 小时前
「AI学习笔记」RNN
机器学习·aigc·ai编程
网教盟人才服务平台7 小时前
“方班预备班盾立方人才培养计划”正式启动!
大数据·人工智能
芯智工坊7 小时前
第15章 Mosquitto生产环境部署实践
人工智能·mqtt·开源
菜菜艾7 小时前
基于llama.cpp部署私有大模型
linux·运维·服务器·人工智能·ai·云计算·ai编程
TDengine (老段)7 小时前
TDengine IDMP 可视化 —— 分享
大数据·数据库·人工智能·时序数据库·tdengine·涛思数据·时序数据
小真zzz7 小时前
搜极星:第三方多平台中立GEO洞察专家全面解析
人工智能·搜索引擎·seo·geo·中立·第三方平台
GreenTea8 小时前
从 Claw-Code 看 AI 驱动的大型项目开发:2 人 + 10 个自治 Agent 如何产出 48K 行 Rust 代码
前端·人工智能·后端
火山引擎开发者社区8 小时前
秒级创建实例,火山引擎 Milvus Serverless 让 AI Agent 开发更快更省
人工智能