RAG的技术发展

RAG 技术已从早期的‌朴素检索（Naive RAG）‌演进为具备‌结构化推理‌与‌智能体自主决策‌的复杂系统。当前主流技术范式及演进逻辑如下：

‌定义‌：最基础形态，流程为"文档切块→向量化→向量检索→拼接生成"。

‌局限‌：仅依赖语义相似度，难以处理多跳推理、全局宏观理解及实体间复杂关系，易产生幻觉。

‌地位‌：当前工业界简单问答场景的基线标准，但正逐渐被高级范式补充或替代。‌‌

‌核心‌：引入‌知识图谱‌，将非结构化文本转化为"实体 - 关系"图结构，支持‌社区聚类‌与‌分层摘要‌。

‌优势‌：解决 Naive RAG"连点成线"难题，擅长‌全局理解‌（如总结整个知识库趋势）和‌多跳推理‌ 。

‌代价‌：构建成本高（需大量 LLM 抽取实体），增量更新困难，适合静态或低频更新的大规模知识库。

‌代表‌：Microsoft GraphRAG（2024 年主推），通过 Leiden 算法聚类实现 Global Search 与 Local Search 。‌‌

‌

‌核心‌：2026 年新晋 SOTA 范式，用‌关系型数据库（SQL）‌重构数据底座。将文本解析为"事项（Event）+ 实体（Entity）"，利用‌超边结构‌连接多对多关系。

SAG（SQL 检索增强生成）‌：全称 SQL-Retrieval Augmented Generation，通过 SQL 驱动检索部分，重构 Agent 数据底座。

‌核心架构‌：离线阶段将原始文本整理成"事项 + 实体"的数据库结构，查询时用 SQL 动态串联局部线索网。

‌超边结构‌：一个事件（event）可连接多个实体（entity），形成多对多关联，比三元组更轻便且保留完整语义。

‌混合检索‌：结合 SQL 精准检索和向量语义匹配能力，既支持实体精确匹配，也支持语义模糊搜索

‌优势‌：

‌动态扩展‌：无需预建全局图，查询时通过 SQL Join 临时组装局部线索网，支持‌秒级延迟‌处理亿级数据。 ‌多跳推理强‌：在
HotpotQA 等多跳测试中召回率显著优于 HippoRAG 2，更适合 Agent 长期记忆与状态追踪。
‌易维护‌：支持增量写入，避免 GraphRAG 的全量重建痛点。

‌定位‌：平衡了结构化推理与工程落地成本，是 Agent 时代的高性价比数据底座。‌‌

‌核心‌：赋予模型‌自主决策权‌，模型可判断"是否检索"、"何时检索"及"如何迭代优化"。

‌特点‌：融合工具调用、多轮反思与自我纠错，不再是线性流水线，而是动态规划系统。

‌趋势‌：常与 GraphRAG 或 SAG 结合，作为上层调度器使用。‌‌

LLM Wiki‌：通常指基于维基结构的‌结构化知识库‌范式。不同于 Naive RAG 的扁平切片，它强调‌手动或半自动的 WikiLink‌关联，具备持续积累能力，但缺乏自动化的深度关联推断，常作为 GraphRAG 的数据源或轻量级替代方案。

‌

技术融合趋势‌：单一范式难以通吃，未来主流是‌混合架构‌。例如：底层用 SAG/GraphRAG 存储结构化知识，上层用 Agentic RAG 进行路由与决策，同时支持多模态输入。‌‌谷歌在本月发布的okf标准

‌简单问答/低成本‌：Naive RAG + 重排（Rerank）。

‌全局总结/复杂关系推理‌：GraphRAG（接受高构建成本）。

‌大规模动态数据/Agent 记忆/多跳查询‌：‌SAG‌（当前工程落地优选）。

‌复杂任务规划‌：Agentic RAG（需搭配上述任一检索后端）。