检索增强生成(RAG )系统通过整合外部知识源来增强大型语言模型 (LLM),从而提供更准确、更符合上下文且满足用户需求的响应。然而,现有的RAG 系统存在诸多局限性,例如依赖扁平数据表示和上下文感知不足,这会导致响应碎片化,无法捕捉复杂的相互依赖关系。为了应对这些挑战,我们提出了Light RAG,它将图结构融入文本索引和检索过程中。这一创新框架采用 双层检索系统,能够从底层和高层知识发现两个层面增强信息的全面检索。此外,图结构与向量表示的融合有助于高效检索相关实体及其关系,显著提升响应速度,同时保持上下文相关性。增量更新算法进一步增强了这一能力,确保及时整合新数据,使系统能够在快速变化的数据环境中保持高效响应。大量的实验验证表明,与现有方法相比,Light RAG 在检索精度和效率方面均有显著提高。我们已将 Light RAG 开源,可通过以下链接获取:https://github.com/HKUDS/LightRAG。
