之前听到一个词,叫RAG已死。毫无疑问,在讲究传播效果的技术圈,类似于Serverless之类的脑残词汇,跟这个说法异曲同工,怎么猎奇怎么来,我因此专门找了一下这个说法背后的情况。
"RAG已死"这个说法,并不是指RAG(检索增强生成)技术真的被废弃或淘汰了,而更像是一个行业内的"标题党"式口号,用来形容RAG技术正在经历一场深刻的范式演进和角色转变。
简单来说,它的核心含义是:过去那种简单、粗糙的RAG实现方式已经不够用了,它正在进化成更智能、更强大的形态,或者被封装成更底层的平台能力。
这个说法的兴起,主要有以下几个背景:
🧐 "RAG已死"论调从何而来?
-
长上下文窗口的冲击
随着大模型(如Gemini、Llama 4等)的上下文窗口不断增大,从早期的4K token发展到如今的百万甚至千万级别,一种观点认为:既然可以把海量文档一次性"喂"给模型,为什么还需要复杂的检索系统呢?这引发了第一轮"RAG已死"的讨论。
-
传统RAG的固有缺陷
传统的RAG系统存在明显的天花板,例如:
- 切块(Chunking)困境:切得太细会丢失上下文,切得太粗又会影响检索精度。
- 语义匹配局限:基于向量相似度的检索,只能找到"看起来像"的内容,但无法理解复杂的逻辑关系,难以处理需要多步推理的问题。
- 被动且无状态:它是一个一次性的、被动的管道,不会主动思考、验证或迭代检索结果。
🚀 RAG的进化:从"检索"到"理解"
"RAG已死"的真正含义,是它正在向更高级的形态进化,以解决上述问题。
-
进化为"智能体检索"(Agentic RAG)
这是RAG演进的主要方向。它不再是简单的"查询-检索-生成"管道,而是引入了AI智能体(Agent)来驱动整个流程。这个智能体可以:
- 智能路由:分析用户问题,自动决定是检索文本片段、整个文件还是查询特定数据库。
- 多知识库协同:能够同时查询多个为不同类型文档(如财报、PPT、会议记录)优化的独立索引,并整合结果。
- 主动思考:像一个人类专家一样,先理解文档结构(如目录),再进行逻辑推理和精准定位,而不是盲目地进行相似度匹配。
-
升华为"上下文工程"(Context Engineering)
这个概念由向量数据库Chroma的CEO提出,他认为"RAG已死,上下文工程当立"。这并非否定RAG,而是将关注点从"如何检索"提升到"如何为模型组织最有效的信息"。(越是表述的奇葩,就越有传播效果,真尼玛恶心)
- 核心挑战:研究发现,上下文并非越长越好,信息过载反而会导致模型性能下降(即"上下文腐烂")。
- 工程优化:上下文工程的目标是在有限的窗口内,精心选择和编排最相关的信息,让每一个token都发挥最大价值。这可以看作是RAG在实现层面的精细化方法论。
🔮 RAG的未来:从"明星技术"到"基础设施"
RAG并没有消失,而是正在经历角色的转变。
- 被平台封装,成为"一行API"
以Google的File Search等工具为代表,RAG的复杂流程(切块、索引、检索、引用)被封装成一个简单的API调用。开发者不再需要"手搓"整个RAG系统,而是直接调用平台提供的功能。这让RAG从一个需要专门掌握的技术,变成了一项开箱即用的服务。 - 退居幕后,等待ToB爆发
当前AI应用的热点集中在ToC(面向消费者)的智能体,个人数据量小,对RAG需求不强。但在ToB(面向企业)场景,企业拥有海量、私有的数据,对精确检索、权限控制和合规审计有天然需求。当ToB智能体应用真正爆发时,RAG技术很可能会重回大众视野。
总而言之,"RAG已死"更像是一句警示,提醒从业者粗糙的RAG实践需要进化。它正在从一个独立的、显性的技术模块,演变为AI系统认知基础设施的一部分,以一种更深层、更自主的形态继续发挥作用。
前主流的RAG技术正在进一步深入和发展,如果真的从字面理解,那么就惹人笑了。