AIDD - 基于多层图注意力神经网络的药物-靶点相互作用预测模型研究

Nature | 基于多层图注意力神经网络的药物-靶点相互作用预测模型研究

引言

在药物研发过程中，准确预测**药物与靶点的相互作用（DTI）**对于确定化合物潜在治疗应用十分重要。传统的实验方法验证DTI，虽然可靠，但花费较多且耗时较长。

虽然现有神经网络的方法在 DTI 预测方面取得了重大进展，但它们在整合多源信息或处理药物-靶点相互作用的异质性方面经常出现问题。为此，作者提出了多层图注意力神经网络（MLGANN） ，该网络不仅可以捕获了药物和靶点之间的多层次交互信息，还通过一种新颖的多层注意力机制整合了不同的数据源。最终，作者的实验结果表面，这种方法可以更全面、更准确地预测 DTI。

方法：MLGANN模型设计

2.1 多层DTI网络

MLGANN框架构建了一个多层网络，能够将来自药物和靶点的多源信息整合到一个统一的多层网络中。不像传统模型那样分别处理药物和靶点的关系，MLGANN将多种数据源（如化学结构、药物-疾病关系、副作用等）融合在一个网络中，这使得模型既能够表示药物和靶点的直接交互作用，也能够捕捉它们内部的相似性。

多源矩阵构建：每种药物和靶点都与多个矩阵关联，这些矩阵代表不同的交互和关系类型，例如化学相似性、药物-疾病联系和靶点-疾病关联。
图卷积网络（GCN）层：MLGANN的GCN层用于跨越不同网络层的交互，学习网络中节点的隐藏表示。
自注意力机制：模型使用自注意力机制来整合多源数据，按数据的重要性进行加权，以优化预测结果。

图 1.该图说明了一个多路复用层药物-靶点相互作用（DTI）网络，该网络跨多个层集成了来自药物（D）和靶点（T）的多级信息。左侧显示了不同层次的药物关联（标记为 AD、1、AD、2、AD、3），代表药物 D1、D2、D3 和 D4 之间的各种关系。在右侧，靶点关联以相似的层（AT，1 和 AT，2）描绘，靶点为 T1、T2 和 T3。该图的中央部分显示了药物和靶点之间的相互作用，其中多层网络结构用于捕获不同信息层之间的复杂相互作用。这种多层方法通过考虑层内和层间交互来实现更全面的 DTI 预测

MLGANN模型从网络的多个层级中聚合相邻节点的信息。每层表示一种特定的相似性或交互关系，这使模型既能从直接相邻节点（如具有相似化学结构的药物）中学习，也能从跨层关系（如共享副作用的药物）中学习。这种层次化的聚合方式增强了模型捕捉复杂交互关系的能力，使其优于单层网络。在生成最终的节点嵌入向量时，MLGANN使用多层注意力池化来加权聚合各层的信息，根据每个数据源在网络中的相关性进行调整。最终输出是每种药物和靶点的精细化表示，供DTI预测使用。

性能对比与分析

表1. 作者的模型与数据集 DTI 上的基线的比较。每次测量的最高和第二高结果分别以粗体和斜体显示。使用单侧配对 t 检验，与第二高的绩效相比，最佳模型表明 Pvalue 水平有显著改善。、* 分别代表 1% 和 0.1% 的显著水平。

研究者基于DrugBank数据集进行对比实验，将MLGANN的表现与多种基线模型进行了比较，包括基于相似性、知识图谱和图神经网络（GNN）的模型。关键评价指标包括精度、召回率、F1得分、AUC（ROC曲线下面积）以及AUPR（精确率-召回率曲线下面积）。

预测精度提升：由于MLGANN有效地利用了多源数据，在AUC和精度等指标上取得了显著的提升。
消融实验：消融实验进一步验证了模型中各层的重要性，表明移除特定层（如药物-疾病相似性）会导致显著的性能下降。
鲁棒性测试：通过随机移除部分训练数据来测试模型的鲁棒性，结果表明MLGANN在不同数据量下仍保持较高性能，并且在训练数据减少时表现出最小的性能衰减。

MLGANN模型对比传统方法的优势

MLGANN模型在多层结构和自注意力机制的加持下展现了超越传统DTI预测方法的显著优势。

区别于仅依赖化学结构或蛋白质序列的模型，MLGANN可以通过整合药物和靶点的多种信息，构建更为全面的潜在相互作用图景，从而能够捕捉更多关键数据。与同质模型不同，MLGANN的多层结构保留了药物-靶点交互的多样性，为更准确的预测提供了保证。MLGANN的设计灵活，可以进一步扩展以融入更多的数据源，使其具有很强的适应性，便于未来在DTI预测中的应用和拓展。

局限性与未来方向

尽管MLGANN在DTI预测中取得了显著进展，但仍然存在一些局限：

数据依赖性：模型的精度依赖于数据源的质量和完整性，数据缺失或不一致可能导致预测效果下降。
复杂性与计算成本：多层结构虽然有效，但需要大量计算资源，在计算能力受限的情况下可能限制其应用。

未来的研究可以进一步整合更多样化的生物数据源（如基因组和表观遗传信息）以提高预测的准确性。此外，优化模型的效率并将其应用于真实药物再利用情境，将为其在制药研究中的实际应用奠定基础。

结论

MLGANN在DTI预测领域的创新性是可以将GCN和注意力机制结合在一个多层框架中。MLGANN通过整合多种药物和靶点信息，实现了更准确和稳健的DTI预测，为加速药物发现和再利用提供了巨大潜力。MLGANN在解决现有模型局限的同时，为计算药理学的进一步创新铺平了道路，有助于开发新的治疗策略。

参考资料：Lu, Q., Zhou, Z. & Wang, Q. Multi-layer graph attention neural networks for accurate drug-target interaction mapping. Sci Rep 14, 26119 (2024). https://doi.org/10.1038/s41598-024-75742-1