RAG is really dead? 大模型和知识之间的桥梁没了?

作者:SpaderMan

从 RAG 到上下文工程:理性思考 AI 应用开发,以交付业务结果为目标

最近,Latent Space 播客发布了一期标题为["RAG 已死,上下文工程为王"](https://www.latent.space/p/chroma ""RAG 已死,上下文工程为王"")的访谈,其中开源向量数据库 Chroma 的创始人 Jeff Huber 的观点引发了广泛讨论。这个观点触及了一个核心问题:我们是否真的理解自己在构建什么?

理解 RAG:概念与争议

RAG(Retrieval Augmented Generation,检索增强生成)是当前 AI 应用的主流技术架构。其核心思想是:当大语言模型需要回答问题时,先从外部知识库检索相关信息,将这些信息加入到提示词中,最后生成答案。

这个架构解决了大语言模型(LLM)的两个固有问题:知识的时效性和准确性。模型不再依赖训练时的静态知识,而是能够动态获取最新、最相关的信息。

然而,Jeff Huber 对"RAG"这个术语的观点值得我们思考:

"We never use the term RAG. I hate the term RAG... Are three concepts put together into one thing? Like, that's just really confusing."

他的核心观点是:RAG 这个缩写将检索(Retrieval)、增强(Augmented)、生成(Generation)三个独立且复杂的环节简单组合到了一起。这种"概念打包"带来的副作用使许多开发者误认为搭建了向量检索就算实现了 RAG,而忽略了每个环节都需要的精心设计和优化。

上下文工程(Context Engineering)的本质

Jeff Huber 提出的上下文工程定义:

"Context engineering is the job of figuring out what should be in the context window for any given LLM generation step."

上下文工程关注的核心问题是:在有限的上下文窗口中,如何选择和组织最相关的信息,以获得最佳的生成效果。

这个概念的提出基于一个重要发现------上下文腐烂(Context Rot)。Chroma 的研究表明,大语言模型(LLM)的性能并非随上下文长度线性提升。相反,当上下文包含过多信息时,模型的注意力会分散,推理能力会下降。即使是拥有百万 token 窗口的模型,最佳性能往往出现在 2000-5000 tokens 的范围内。

这个发现颠覆了"信息越多越好"的直觉。上下文工程的核心挑战就在于此:如何在信息充分性和信息过载之间找到最佳平衡点。

RAG 与上下文工程:对立还是互补

表面上看,RAG 和上下文工程似乎是对立的概念。但深入分析后,我们认为它们代表了同一问题的不同层次:

RAG 是架构层面的解决方案。它定义了一个清晰的系统结构:外部知识库、检索机制、生成模型。这个架构本身是合理且有效的。

上下文工程是实现层面的优化方法论。它不否定 RAG 架构,而是深化了对"增强"环节的理解。当我们的关注点从'如何检索信息'转向'如何组织信息'时,实际上是在做更精细的工程优化。

这种关系类似于"算法"与"工程"的关系。算法提供理论框架,工程关注实际效果。RAG 告诉我们"要检索",上下文工程告诉我们"如何更好地利用检索结果"。

超越概念之争

这场讨论的价值不在于判定 RAG 或上下文工程孰优孰劣,而在于它促使我们重新思考 AI 应用开发的方法论。

第一,警惕概念简化。当复杂系统被简化为流行词汇时,实践者容易陷入表面理解。真正的工程能力体现在对每个组件的深入理解和精细优化。

第二,重视工程思维。Jeff 反复强调要让 AI 开发"更像工程,更少像炼金术"。这意味着建立可测量的目标、可重复的流程、可验证的改进。

第三,平衡理论与实践。RAG 提供了有用的概念框架,上下文工程强调了实践优化。两者结合才能构建真正可用的系统。

结语: 从概念验证到工程优化

"RAG 已死"更像是一种警示,其真正含义是:粗糙的、教条的 RAG 实践需要进化。上下文工程不是要替代 RAG,而是让 RAG 变得更加精细和有效。

无论是 RAG 还是上下文工程,本质都是在有限的计算资源下,为 AI 提供最有用的信息。名词会变,但工程师解决问题的使命不变。真正的进步,是让每一个 token 都有价值,让每一次推理都更精准。

这场讨论的最大意义在于:它提醒我们,AI 应用正在从"能跑"走向"跑得好",从概念验证走向工程优化。这是整个行业走向成熟的标志。

关于 Spader.AI

Spader.AI ,北京与星以舟智能科技有限公司,是一支专注于人工智能与云计算技术的创新团队,致力于推动前沿技术的发展和实际应用。

我们构建高性能、可扩展的 AI 基础设施,提供灵活、安全的智能解决方案,帮助企业轻松应对复杂计算任务,加速 AI 应用落地。我们相信,智能技术应当开放、可及,并真正创造价值。因此,我们不断优化算法与架构,以提升算力效率、降低使用门槛,让人工智能成为推动产业升级的重要驱动力。

如果您对高性价比算力、大模型训练训练及推理以及相关业务场景的技术感兴趣,或者对本篇分享中提到的某些观点有自己的见解希望讨论,扫码秒加 SpaderMan 客服,SpaderMan 会带您入群,和各领域技术大佬共同探讨最前沿的 AI 技术。

相关推荐
zskj_qcxjqr2 小时前
数字大健康崛起:艾灸机器人重构就业生态,传统与科技如何共生?
大数据·人工智能·科技·机器人
云澈ovo2 小时前
AI+传统工作流:Photoshop/Excel的智能插件开发指南
人工智能·excel·photoshop
kalvin_y_liu3 小时前
【深度相机术语与概念】
人工智能·数码相机·具身智能
山烛3 小时前
计算机视觉:OpenCV+Dlib 人脸检测
图像处理·人工智能·opencv·计算机视觉·人脸识别·dlib
小苑同学3 小时前
研究生如何看懂文献?
人工智能·安全·网络安全·安全性测试
补三补四3 小时前
图卷积网络 (GCN)
网络·人工智能·深度学习·神经网络·算法·机器学习
zhglhy3 小时前
大语言模型在金融风控中的应用
人工智能·语言模型·自然语言处理
小椿_3 小时前
AI 驱动视频处理与智算革新:蓝耘MaaS释放海螺AI视频生产力
人工智能·深度学习·音视频
AI technophile3 小时前
OpenCV计算机视觉实战(25)——立体视觉详解
人工智能·opencv·计算机视觉