RAG 技术已从早期的朴素检索(Naive RAG)演进为具备结构化推理与智能体自主决策的复杂系统。当前主流技术范式及演进逻辑如下:
Naive RAG(原生/基础 RAG)
定义:最基础形态,流程为"文档切块→向量化→向量检索→拼接生成"。
局限:仅依赖语义相似度,难以处理多跳推理、全局宏观理解及实体间复杂关系,易产生幻觉 。
地位:当前工业界简单问答场景的基线标准,但正逐渐被高级范式补充或替代 。
GraphRAG(图谱增强 RAG)
核心:引入知识图谱,将非结构化文本转化为"实体 - 关系"图结构,支持社区聚类与分层摘要。
优势:解决 Naive RAG"连点成线"难题,擅长全局理解(如总结整个知识库趋势)和多跳推理 。
代价:构建成本高(需大量 LLM 抽取实体),增量更新困难,适合静态或低频更新的大规模知识库 。
代表:Microsoft GraphRAG(2024 年主推),通过 Leiden 算法聚类实现 Global Search 与 Local Search 。
SAG (SQL-Retrieval Augmented Generation)
核心:2026 年新晋 SOTA 范式,用关系型数据库(SQL)重构数据底座。将文本解析为"事项(Event)+ 实体(Entity)",利用超边结构连接多对多关系。
SAG(SQL 检索增强生成):全称 SQL-Retrieval Augmented Generation,通过 SQL 驱动检索部分,重构 Agent 数据底座。
核心架构:离线阶段将原始文本整理成"事项 + 实体"的数据库结构,查询时用 SQL 动态串联局部线索网 。
超边结构:一个事件(event)可连接多个实体(entity),形成多对多关联,比三元组更轻便且保留完整语义 。
混合检索:结合 SQL 精准检索和向量语义匹配能力,既支持实体精确匹配,也支持语义模糊搜索
优势:
- 动态扩展:无需预建全局图,查询时通过 SQL Join 临时组装局部线索网,支持秒级延迟处理亿级数据 。 多跳推理强:在
HotpotQA 等多跳测试中召回率显著优于 HippoRAG 2,更适合 Agent 长期记忆与状态追踪 。
易维护:支持增量写入,避免 GraphRAG 的全量重建痛点 。
定位:平衡了结构化推理与工程落地成本,是 Agent 时代的高性价比数据底座 。
Agentic RAG(智能体 RAG)
核心:赋予模型自主决策权,模型可判断"是否检索"、"何时检索"及"如何迭代优化"。
特点:融合工具调用、多轮反思与自我纠错,不再是线性流水线,而是动态规划系统 。
趋势:常与 GraphRAG 或 SAG 结合,作为上层调度器使用 。
LLM Wiki
LLM Wiki:通常指基于维基结构的结构化知识库范式。不同于 Naive RAG 的扁平切片,它强调手动或半自动的 WikiLink关联,具备持续积累能力,但缺乏自动化的深度关联推断,常作为 GraphRAG 的数据源或轻量级替代方案 。
技术融合趋势:单一范式难以通吃,未来主流是混合架构。例如:底层用 SAG/GraphRAG 存储结构化知识,上层用 Agentic RAG 进行路由与决策,同时支持多模态输入 。谷歌在本月发布的okf标准
选型建议
简单问答/低成本:Naive RAG + 重排(Rerank)。
全局总结/复杂关系推理:GraphRAG(接受高构建成本)。
大规模动态数据/Agent 记忆/多跳查询:SAG(当前工程落地优选)。
复杂任务规划:Agentic RAG(需搭配上述任一检索后端)。