论文:EventRAG: Enhancing LLM Generation with Event Knowledge Graphs
ACL 2025
作者:Zairun Yang、陈华均 et al. (浙江大学)
核心关键词:KGQA | Event Knowledge Graphs | RAG | Agent
一、 动机与问题背景 (Motivation & Background)
传统的 RAG 系统主要在文档、段落或句子层面处理文本,这种方式在处理叙事性较强的文档时存在以下局限性:
忽视事件结构(Event-Centric Challenges):传统方法往往将文档视为扁平的文本,忽略了塑造现实世界叙事的底层事件结构。
时间与逻辑缺失(Temporal-Aware Limitations):在需要时间信息、逻辑依赖和复杂跨事件交互的场景下,传统系统难以保持连贯的时间线,容易导致参考不一致或故事情节不完整 。
多事件推理困难(Multi-Event Reasoning):现有的 RAG 模型多依赖单次检索或简单的片段拼接,无法有效支持处理跨多个来源、需逻辑一致性检查的复杂多跳(Multi-hop)查询,从而导致生成内容出现幻觉或叙事支离破碎 。
为解决上述问题,本文提出一种创新的事件中心检索增强生成框架EventRAG,该框架将文本信息显式组织为结构化的事件知识图谱(EKG)。
二、 方法概览
EventRAG是一种以事件为中心 的 RAG 框架,其核心思想是将文本信息组织成结构化的事件知识图谱(Event Knowledge Graph, EKG)
如下图所示,EventRAG框架包括两个主要阶段:1)事件知识图谱构建、 2)基于事件的检索和生成。
第一阶段,EventRAG将文本分解为一系列事件,将关键事件组件(如参与者和时间标记)作为知识图谱中的节点,同时提取事件间的逻辑关系作为边。
这些元素接下来被组织成事件知识图谱(EKG)。通过合并重复或语义等价的实体,并扩展连接不足的节点,EventRAG构建出全面且无冗余的知识骨干。
第二阶段中,智能体通过EKG检索相关信息,执行多步推理,并基于结构化事件知识生成输出。
通过聚焦事件,EventRAG实现了对文本更具语义丰富性与时间根基的理解,捕捉事件间的逻辑关联与时间序列等相互依赖关系,逐步优化局部推理结果并修正矛盾信息。
该机制使系统能够串联多事件链、构建逻辑关联并验证关键信息,从而确保逻辑一致性并减少幻觉现象。

三、 方案详情
EventRAG框架旨在通过强调三个关键维度来解决与叙事丰富的文档相关的挑战:以事件为中心,时间感知和多事件推理。
下面以事件知识图构建 和 基于事件的检索和生成 这两个主要阶段来详细介绍EventRAG的工作流程。
1. 事件知识图谱构建 (Event Knowledge Graph Construction)
EventRAG采用LLM从文本中提取事件、实体及其相互关系。提取过程为双流处理,第一流中将提取内容向量化并如库,支持语义检索;第二流中通过语义合并消除冗余。最后整合双流结果,构建以事件为中心的知识图谱。其中包含下面两个关键步骤。
-
实体融合 (Fuse Entities):针对不同文档中对同一实体或事件的不同表达,系统采用基于向量相似度的匹配机制进行合并,以减少冗余并确保知识的一致性 。
-
知识扩展 (Expand Knowledge):识别图谱中连接薄弱的节点,利用文档上下文或 LLM 的内置知识填补空白,增强图谱的连贯性和推导能力 。
2. 基于事件的检索和生成 (Event-based Retrieval and Generation)
在构建丰富的EKG之后,EventRAG可以执行检索和生成任务。EventRAG利用EKG以事件为中心的结构来进行复杂的信息处理,迭代的多事件推理和时间意识,使其能够处理复杂的查询并生成连贯的、基于上下文的输出。具体而言,EventRAG的检索和生成流程包括以下几个步骤:
-
自主图谱查询(Autonomous EKG Querying):用户输入的查询被分解为与事件相关的组件(例如,逻辑关系、参与者、时间标记),并从 EKG 中检索最相关的事件节点及其相互连接。
-
时间感知推理(Temporal-Aware Inference):提取事件间的时间标记和先后关系,使系统能够捕获静态事件细节和事件随时间的动态演变。在EKG构建阶段,这些时间标记被处理为事件节点的属性,并且时间关系被提取为事件之间的边。
-
迭代式多跳推理(Multi-Event Reasoning):EventRAG通过迭代查询和多跳推理实现多事件推理。首先根据输入查询从EKG中匹配到一组初始的相关事件。然后利用EKG中的逻辑和时间关系,迭代查询EKG以检索相关事件。在每一次迭代中都会通过将逻辑上或时间上相连的事件链接在一起,构建中间推理路径来更新其理解。这些路径将根据图结构进行验证以确保一致性,并根据新发现的连接动态更新其焦点。
-
反思与自纠正:智能体会定期评估结论的逻辑一致性,若发现矛盾或歧义,将重新检查 EKG 中的相关节点以纠正潜在的幻觉。在完成推理过程并经历反思之后生成最终输出。
四、 优缺点分析
优点
-
更强的逻辑性与全面性:实验显示,EVENTRAG 在叙事性任务中的表现优于 NaiveRAG 和 GraphRAG,特别是在内容的逻辑流和覆盖面上 。
-
推理准确度高:在多跳推理和时间敏感型查询中,其答案准确率较基准模型(如 LightRAG)有显著提升 。
-
减少幻觉:通过自纠正机制和结构化知识验证,能够有效识别信息不足的情况,减少过度自信的错误回答 。
缺点与局限
- 计算开销大:在图谱构建阶段,需要多次调用 LLM 进行提取、融合和扩展,导致计算开销较高 。
- 处理速度慢:多步骤的提取过程在处理大规模文档集时响应较慢,可能不适用于对实时性要求极高的场景 。
- 过度依赖推断的风险:其强大的时间推理能力可能导致系统在处理尚在发展的实时新闻或社会事件时,给出过于简化或超前的推断结果 。
参考:
EventRAG: Enhancing LLM Generation with Event Knowledge Graphs