论文浅尝 | 简单即有效:图和大型语言模型在基于知识图谱的检索增强生成中的作用(ICLR2025)

笔记整理:张婷,东南大学硕士,研究方向为自然语言处理

论文链接:https://arxiv.org/abs/2410.20724

发表会议:ICLR 2025

1. 动机

随着大规模语言模型(Large Language Models,LLMs)展现出强大的推理能力,但它们仍面临着信息错乱和知识过时的问题。为了弥补这一缺陷,基于知识图谱(Knowledge Graph,KG)进行的检索增强生成(Retrieved Augmented Generation,RAG)方法已经成为一种有效的策略,它通过在结构化外部知识库中寻找相关信息来解决这些问题。然而,现有的基于KG的RAG框架依然难以在检索效果与效率之间找到合适的平衡。针对该问题,作者提出了SubgraphRAG框架,创新地利用了轻量级的多层感知机(MLP)与并行三元组评分机制来高效地进行子图检索,并通过方向性结构距离编码(Directional Distance Encoding,DDE)增强了检索的有效性。此外,本方法通过灵活调整检索的子图大小,能够根据查询需求与下游LLMs的能力,灵活地调整检索结果。

2. 贡献

本文的主要贡献有:

1)通过MLP与并行三元组评分机制的结合,提高了子图的检索效率,同时保留了结构化的推理能力。

2)采用DDE来对三元组的结构关系进行建模,增强了多跳推理任务中的结构信息有效性。

3)提出了可以灵活调整检索子图大小的机制,以适应不同规模的LLMs,且无需微调,保证了在多种查询情况下的推理能力。

3. 方法

该方法框架由三大模块组成:主题实体提取、子图检索、LLM推理,如图1所示:

图1整体框架图

首先,从输入的查询中提取出相关的主题实体,这些实体是检索子图的核心信息来源。

然后,通过并行三元组评分机制,根据主题实体从知识图谱中检索出最相关的若干个子图,并进行组合。该检索器采用代理子图通过启发式方法,计算最大似然估计(MLE)使用弱监督信号进行训练,如公式(1):

将子图分布按三元组独立因子化,对候选三元组独立给出被选中的概率并并行采样与排序,如公式(2)所示:

具体地,该过程的打分器是一个轻量级的MLP模型,分别从语义信息和结构信息两方面进行评分。

其中,语义信息的计算方式为将问题、三元组中的实体和关系的文本描述编码成向量,以显示它们在语义上是否匹配。

在结构信息的计算上,该论文引入方向性结构距离编码(Directional Distance Encoding,DDE)对三元组进行建模,来计算每个实体到"主题实体"的结构距离。具体地,对于每一个实体,通过公式(3)计算其多轮正反双向均值扩散,得到其实体签名:

然后,对签名拼接得到实体的表征,再把头、尾实体拼接,得到最终的三元组结构特征。

最后,将上一步得到的子图线性化,然后和问题一起,填充到一个设计好的提示模板中,输入LLM。LLM接收到这个包含"问题+证据"的提示后,开始推理并得到答案。

4. 实验

实验设计旨在系统地回答以下四个核心研究问题:

Q1(整体检索效果与效率):SubgraphRAG 能否在满足低延迟要求的同时,有效地检索出相关信息?

Q2(复杂问题处理能力):对于需要多跳推理和涉及多个主题实体的复杂问题,SubgraphRAG 能否有效整合结构信息进行检索?

Q3(问答任务性能):SubgraphRAG 在知识图谱问答任务上的整体表现如何?哪些因素影响其准确性?

Q4(可解释性与抗幻觉能力):该框架能在多大程度上为答案提供有效的、基于知识的解释,从而减少幻觉?

实验设置使用了WebQSP和CWQ两个具有挑战性的多跳推理数据集,评估了SubgraphRAG在复杂查询中的表现。并且对数据集分别去除答案不在KG中的样本,得到子集WebQSP-sub 和CWQ-sub用于评估无幻觉问答能力。

表1为检索实验的结果,它显示SubgraphRAG 在所有召回率指标上均显著且一致地优于所有基线方法。在效率上,SubgraphRAG 仅比最简单的余弦相似度基线稍慢,但比其他检索方法快一至两个数量级。回答了Q1和Q2。

表1检索性能实验结果

表2和表3为问答实验的结果,它显示SubgraphRAG 在数据集及其子集上达到SOTA或具有竞争力的精度。回答了Q3和Q4

表2问答实验结果

表3问答实验结果

此外,论文还设置了问题的跳数实验等实验,进一步说明了该方法在多跳问题上的优势。并且,通过对检索结果深入分析,验证了检索证据的可解释性与可靠性。

5. 总结

在知识图谱与大语言模型相结合的检索增强生成框架中,如何平衡检索效率与推理能力一直是关键挑战。本文提出的SubgraphRAG框架,通过引入创新的子图检索与推理机制,有效解决了这一问题。该框架采用轻量级多层感知机与并行三元组评分机制,实现了高效且灵活的子图检索,并结合方向性距离编码以增强结构感知能力,从而在检索阶段即可捕捉多跳推理所需的关键路径。实验结果表明,SubgraphRAG在WebQSP和CWQ等多跳知识问答基准测试中表现卓越,不仅显著提升了答案的准确性与可解释性,还在效率上优于传统基于路径或迭代检索的方法。尤为值得注意的是,SubgraphRAG在不进行任何模型微调的情况下,仅通过提示工程与上下文学习,即可使中小规模模型(如Llama3.1-8B)达到与GPT-4o等大型模型相媲美甚至更优的性能,展现出强大的泛化能力与实用性。此外,SubgraphRAG还具备良好的可扩展性与适应性,能够根据不同下游模型的推理容量动态调整子图规模,有效缓解了信息冗余与中间迷失问题。其在减少幻觉生成、增强答案可解释性方面的优势,进一步验证了该框架在实际应用中的高可靠性与广泛适用潜力。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

点击阅读原文 ,进入 OpenKG 网站。

相关推荐
萤丰信息2 小时前
科技赋能・智慧引领:新时代智慧园区系统性建设与高质量发展路径
人工智能·科技·安全·重构·智慧城市·智慧园区
天疆说2 小时前
【拓扑学+航天轨道动力学】同伦(Homotopy)概念解析
人工智能·算法·拓扑学
新缸中之脑2 小时前
向LLM提供数据的最佳方式
人工智能
入门工作者2 小时前
opencv 插值法亚像素边缘提取
人工智能·opencv·计算机视觉
亚马逊云开发者2 小时前
Kiro IDE 实战体验:亚马逊云科技的 Spec 驱动 AI 编程,写完需求自动出代码
ide·人工智能·科技
彬鸿科技2 小时前
bhSDR Studio/Matlab入门指南(七):单波束图传收发实验界面全解析
人工智能·matlab·sdr·软件定义无线电
压码路2 小时前
OpencClaw安装及常用命令(养龙虾)
人工智能·ai
一灰灰blog2 小时前
从零掌握 Spring AI Alibaba Skill:定义、注册与渐进式披露
人工智能·python·spring
技术小黑2 小时前
TensorFlow学习系列07 | 实现咖啡豆识别
人工智能·学习·tensorflow