【AI Coding】0-工程化视角理解AI Coding与LLM应用的上下文演化

[AI Coding与LLM应用演进方向](#AI Coding与LLM应用演进方向)
- AI应用的问题
- - [AI Coding的问题](#AI Coding的问题)
  - LLM应用的问题
- 主流方案：上下文工程的演进路径
- - 工程化视角：为什么上下文管理是核心命题？
  - [Modern Context Engineering：四象限方法论](#Modern Context Engineering：四象限方法论)
  - [Skills 与 Cowork：让上下文越来越纯粹](#Skills 与 Cowork：让上下文越来越纯粹)
  - 模式对比：一张表看清上下文演化脉络
  - [AI Coding 的设计趋势：系统侧编排取代对话内堆砌](#AI Coding 的设计趋势：系统侧编排取代对话内堆砌)
- 小结

AI Coding与LLM应用演进方向

这个系列会讲一些AI应用的事情，计划从演进方向到工程化应用，从问题到解决问题。

本篇会先讲述AI的问题与现在的主流方案。

AI应用的问题

AI应用在这里指的是AI Coding与LLM应用，在这几年的发展中，AI的应用一直有这不少的问题。

下面就上下文的演化进行说明。

AI Coding的问题

从rules到skills、cowork再到harness。

● 静默执行错误

AI在生成代码时，会根据上下文"脑补"一些不存在的信息。比如你给它一个API文档，它可能会"幻觉"出文档里根本没有的字段，然后基于这个幻觉继续编写调用代码。

这种情况下，代码看似正常跑通了，但实际逻辑完全跑偏。

静默执行错误认知行为，比如上下文幻觉，比如复杂上下文的信息丢失：

复杂任务的细节丢失，比如spec-kit生成的难以用来生成代码的产品白皮书和技术白皮书。

● 上下文信息丢失

现在AI Coding有一个头疼的上下文丢失现象，复杂项目做到后期，前面写过的设计决策、架构约定、业务规则"人间蒸发"。

也就是 Context Rot（上下文衰减），随着上下文窗口中的token增加，模型准确调用信息的能力会下降。

● 需求传递损耗

产品文档写得很好，但AI生成的代码完全不对味。或者分析的计划很好，但是执行计划的时候错漏百出。

比如Spec-Kit，从产品白皮书→技术方案→代码，这条信息传递链上存在巨大的语义损耗。

LLM应用的问题

从Simple RAG到Multi Agent，从Prompt Engine到Context Program。

RAG我们需要大量的召回，维护知识库。

Multi Agent我们需要复杂的记忆架构、角色拆分来应对逐步爆炸切各Agent之间不一定同步的上下文。

主流方案：上下文工程的演进路径

这些问题，无一不在诉说着我们需要对上下文进行更高效的管理。

随着 AI 能力的提升，我们在用越来越少的上下文工程，做到越来越高效的事情。

这背后有一条清晰的工程化演进脉络：

从"对话内堆上下文"→ 到"系统侧编排上下文"。

工程化视角：为什么上下文管理是核心命题？

从工程化的视角来看，AI Coding 与 LLM 应用的所有问题，本质上都可以归结为一件事：

如何在有限的上下文窗口里，让模型拿到它真正需要的信息，同时屏蔽掉它不需要的噪声。

早期的解法很直白：信息不够？塞进去。效果不好？再塞。

Prompt 里堆满了规则、示例、API 文档节选，上下文窗口越用越长，

模型却越来越"迷糊"------这就是典型的上下文膨胀陷阱。

真正稀缺的不是上下文长度，而是有效 Context 的组织能力 。

LLM 能力越强，我们越敢于做"减法"。

Modern Context Engineering：四象限方法论

现代上下文工程的核心，可以用四个维度来描述：

策略	含义	典型手段
Offload（外置）	将信息存到外部，不占窗口	向量库、知识图谱、外部记忆系统
Retrieve（精召）	按需精准检索，而非全量注入	grep、LSP、语义搜索、结构化查询
Reduce（压缩）	对已有上下文进行智能摘要与裁剪	滑动窗口、摘要链、Token 预算管理
Isolate（隔离）	任务级别的上下文隔离，避免污染	Skills、子 Agent、独立会话

正如 Claude Code 用 grep 替代全量向量检索------

正确的工具 + 精简上下文，远胜于冗长提示词堆砌。

当 LLM 不再被噪声淹没，静默执行错误、需求传递损耗等顽疾自然消解。

这正是"用更少上下文工程实现更高效能"的底层逻辑。

Skills 与 Cowork：让上下文越来越纯粹

近几个月火爆的 Skills 与 Cowork 模式，正在让上下文越来越少、越来越纯粹。

因为不再需要 LLM 使用大量的上下文去推理，去分析在长对话后可能出现幻觉的问题，

而是将任务直接派发给一个预置了专项能力和极简上下文的 Skill。

● Skills（技能）：可以理解为一个个"即插即用"的微服务

每个 Skill 都高度专业化（例如 ReactComponentSkill、SQLQuerySkill），

其内部已经固化了执行特定任务所需的最核心指令和工具。

当 LLM 接到一个复杂请求时，它不再需要翻阅大量的 API 文档和历史对话来"学习"，

它只需要做一个简单的路由决策："这个任务应该调用哪个 Skill？"

● Cowork（协同）：这是 Skills 模式的自然延伸

当一个任务需要多个 Skills 协同时，一个轻量的"协调者"（Orchestrator）会出场。

它的上下文极其纯粹：只包含任务目标、可用的 Skills 列表以及它们之间的输入输出约定。

它不关心每个 Skill 内部是如何实现的，只负责按照工作流将它们串联起来。

这就好比一个项目经理，他不需要懂得如何敲代码或画设计图，

但他清楚地知道：应该先让设计师出稿，再让工程师开发，最后让测试验收。

● ClawBot：协同的更高形态------容错与接替

如果说 Cowork 是让多个 Skills 像团队一样"各司其职"，

那么 ClawBot 则是让这个团队具备了**"主动补位"**的能力。

它的核心思想是动态故障检测与任务重新路由：

某个 Skill 执行失败？自动切换备用路径；
某段上下文检索结果置信度低？主动触发二次召回；
多个 Skill 输出结果有冲突？由 Validator 层进行裁决。

ClawBot 的本质，是将传统 Agentic Loop 中"人工兜底"的部分，自动化地内建进了系统架构。

模式对比：一张表看清上下文演化脉络

模式	核心逻辑	上下文特征	核心痛点解决
Simple RAG	向量匹配 Top-K	碎片化、易丢失逻辑	补充外部静态知识
Multi-Agent	角色分工 + 状态机	冗余度高、同步难	处理跨模块复杂任务
Skills/Cowork	工具化 + 状态共享	精简、确定性高	消除推理幻觉，提升执行力
ClawBot	Agentic Search（grep/LSP）	按需加载、自验证	解决大规模工程的检索精度

AI Coding 的设计趋势：系统侧编排取代对话内堆砌

很多"需要塞进上下文让模型现场推理的东西"，

被前置固化为可复用的能力 / 工具 / 流程 ，

从而让在线上下文更短、更稳定，执行速度和输出一致性更好。

这不是"上下文工程变少了"，

而是从对话内上下文 迁移到了系统侧上下文编排 （检索、记忆、路由、工具协调），

仍然属于上下文工程的范畴。只不过，战场从 Prompt 窗口里，转移到了系统架构层。

用一句话总结这个趋势：

模型越强，越要让它专注于"决策"，而非"记忆"。

公司的 Aone Copilot 就很有潜力，是集成 Skills、Rules、McpServers 等配置的很好的平台。

它正在做的事，恰好是这套方法论的工程落地------把上下文的组织能力，沉淀进平台，而非每次都由开发者手工拼接。

小结

本篇从工程化视角出发，梳理了 AI Coding 与 LLM 应用在上下文演化这条主线上的核心问题与主流方案：

问题侧：

静默执行错误（上下文幻觉）
Context Rot（上下文衰减）
需求传递损耗（语义损耗）

方案侧：

Simple RAG → Multi-Agent → Skills/Cowork → ClawBot

↓ ↓ ↓ ↓

全量召回角色分工工具路由自主容错

（堆信息）（堆角色）（减上下文）（自愈系统）

趋势侧：

上下文工程的重心，从"对话内塞信息"转向"系统侧精准编排"。

越来越少的上下文，越来越高的执行确定性。

下一篇，我们将进入具体的工程化实践：

如何在真实项目中设计一套可落地的 Skills 体系？

从 Skill 的定义、注册、路由，到多 Skill 协同的编排设计，以及踩过的那些真实的坑。