作者:SpaderMan
从 RAG 到上下文工程:理性思考 AI 应用开发,以交付业务结果为目标
最近,Latent Space 播客发布了一期标题为["RAG 已死,上下文工程为王"](https://www.latent.space/p/chroma ""RAG 已死,上下文工程为王"")的访谈,其中开源向量数据库 Chroma 的创始人 Jeff Huber 的观点引发了广泛讨论。这个观点触及了一个核心问题:我们是否真的理解自己在构建什么?
理解 RAG:概念与争议
RAG(Retrieval Augmented Generation,检索增强生成)是当前 AI 应用的主流技术架构。其核心思想是:当大语言模型需要回答问题时,先从外部知识库检索相关信息,将这些信息加入到提示词中,最后生成答案。
这个架构解决了大语言模型(LLM)的两个固有问题:知识的时效性和准确性。模型不再依赖训练时的静态知识,而是能够动态获取最新、最相关的信息。
然而,Jeff Huber 对"RAG"这个术语的观点值得我们思考:
"We never use the term RAG. I hate the term RAG... Are three concepts put together into one thing? Like, that's just really confusing."
他的核心观点是:RAG 这个缩写将检索(Retrieval)、增强(Augmented)、生成(Generation)三个独立且复杂的环节简单组合到了一起。这种"概念打包"带来的副作用使许多开发者误认为搭建了向量检索就算实现了 RAG,而忽略了每个环节都需要的精心设计和优化。
上下文工程(Context Engineering)的本质
Jeff Huber 提出的上下文工程定义:
"Context engineering is the job of figuring out what should be in the context window for any given LLM generation step."
上下文工程关注的核心问题是:在有限的上下文窗口中,如何选择和组织最相关的信息,以获得最佳的生成效果。
这个概念的提出基于一个重要发现------上下文腐烂(Context Rot)。Chroma 的研究表明,大语言模型(LLM)的性能并非随上下文长度线性提升。相反,当上下文包含过多信息时,模型的注意力会分散,推理能力会下降。即使是拥有百万 token 窗口的模型,最佳性能往往出现在 2000-5000 tokens 的范围内。
这个发现颠覆了"信息越多越好"的直觉。上下文工程的核心挑战就在于此:如何在信息充分性和信息过载之间找到最佳平衡点。
RAG 与上下文工程:对立还是互补
表面上看,RAG 和上下文工程似乎是对立的概念。但深入分析后,我们认为它们代表了同一问题的不同层次:
RAG 是架构层面的解决方案。它定义了一个清晰的系统结构:外部知识库、检索机制、生成模型。这个架构本身是合理且有效的。
上下文工程是实现层面的优化方法论。它不否定 RAG 架构,而是深化了对"增强"环节的理解。当我们的关注点从'如何检索信息'转向'如何组织信息'时,实际上是在做更精细的工程优化。
这种关系类似于"算法"与"工程"的关系。算法提供理论框架,工程关注实际效果。RAG 告诉我们"要检索",上下文工程告诉我们"如何更好地利用检索结果"。
超越概念之争
这场讨论的价值不在于判定 RAG 或上下文工程孰优孰劣,而在于它促使我们重新思考 AI 应用开发的方法论。
第一,警惕概念简化。当复杂系统被简化为流行词汇时,实践者容易陷入表面理解。真正的工程能力体现在对每个组件的深入理解和精细优化。
第二,重视工程思维。Jeff 反复强调要让 AI 开发"更像工程,更少像炼金术"。这意味着建立可测量的目标、可重复的流程、可验证的改进。
第三,平衡理论与实践。RAG 提供了有用的概念框架,上下文工程强调了实践优化。两者结合才能构建真正可用的系统。
结语: 从概念验证到工程优化
"RAG 已死"更像是一种警示,其真正含义是:粗糙的、教条的 RAG 实践需要进化。上下文工程不是要替代 RAG,而是让 RAG 变得更加精细和有效。
无论是 RAG 还是上下文工程,本质都是在有限的计算资源下,为 AI 提供最有用的信息。名词会变,但工程师解决问题的使命不变。真正的进步,是让每一个 token 都有价值,让每一次推理都更精准。
这场讨论的最大意义在于:它提醒我们,AI 应用正在从"能跑"走向"跑得好",从概念验证走向工程优化。这是整个行业走向成熟的标志。
关于 Spader.AI
Spader.AI ,北京与星以舟智能科技有限公司,是一支专注于人工智能与云计算技术的创新团队,致力于推动前沿技术的发展和实际应用。
我们构建高性能、可扩展的 AI 基础设施,提供灵活、安全的智能解决方案,帮助企业轻松应对复杂计算任务,加速 AI 应用落地。我们相信,智能技术应当开放、可及,并真正创造价值。因此,我们不断优化算法与架构,以提升算力效率、降低使用门槛,让人工智能成为推动产业升级的重要驱动力。
如果您对高性价比算力、大模型训练训练及推理以及相关业务场景的技术感兴趣,或者对本篇分享中提到的某些观点有自己的见解希望讨论,扫码秒加 SpaderMan 客服,SpaderMan 会带您入群,和各领域技术大佬共同探讨最前沿的 AI 技术。