老板与员工:5分钟理解 Subagent 架构
一、为什么 AI 做复杂任务,总是越做越偏?
很多人用 Claude Code 或 OpenClaw 处理复杂任务时都遇到过这个现象:任务开始时表现不错,但越往后越离谱:忽略之前的约束、重复已经做过的步骤、把早期提到的细节搞错。
直觉上会觉得是模型变差了,但其实不是。这是架构问题。
二、一次典型的失败
设想一个多步骤任务:抓取今日 AI 新闻 → 筛选整理 → 写成日报草稿 → 审核修改 → 转换成各平台格式 → 提交发布。
让单个主 Agent 从头跑到尾,大概从第三步开始就会出现漂移。
原因很简单:上下文窗口是有限的。任务执行过程中产生的中间输出------思考过程、代码片段、报错信息------会持续塞进同一个窗口。200K token 听起来很大,但当窗口达到三分之二的容量时,最开始的需求细节、约束条件、关键背景,就会被稀释到注意力触及不到的地方。
三、解决办法:老板与员工
解法是 Subagent 架构。一句话概括:主 Agent 是老板,Subagent 是有干净脑子的员工。
干净的上下文
每个 Subagent 启动时都带着一个全新的上下文窗口,只装这次任务需要的信息,不背负主 Agent 积累的所有历史。这就是"干净脑子"的含义------不是更聪明,而是没有包袱。
任务书而非对话
主 Agent 给 Subagent 分配任务时,靠的是一份明确的任务书,而不是共享上下文。Subagent 完成后,把结果摘要汇报回来,主 Agent 只需要消化结论,不需要重放整个执行过程。
这和普通的工具调用(Tool Call)不同------工具调用只是函数执行,上下文还是同一个;Subagent 是独立进程,有自己的推理空间。
对应关系
| 管理概念 | Subagent 架构 |
|---|---|
| 老板拆解项目,分配任务 | 主 Agent 规划并派发子任务 |
| 员工只知道自己负责的那块 | Subagent 持有独立上下文 |
| 员工汇报结果,不汇报过程 | Subagent 返回摘要,不暴露中间状态 |
| 多个员工并行工作 | 多个 Subagent 并发执行 |
| 找专人做专事 | 为不同子任务定制不同 Prompt,给 Subagent 一份干净且精准的任务书 |
核心逻辑
分层委派不是 AI 特有的发明。人类组织几千年来用层级结构处理复杂问题,本质上也是在应对个体注意力的上限:
- 军事指挥:罗马军团的士兵 → 百夫长 → 千人队长 → 将军,每层只需盯住直属下级,皇帝不需要知道每个士兵的动向。
- 宗教组织:天主教会的教皇 → 红衣主教 → 主教 → 神父 → 信徒,梵蒂冈一个人管不了全球十几亿信众,但通过层级可以做到。
- 封建制度:国王 → 诸侯 → 骑士 → 农民,国王只需管几十个诸侯,诸侯管几十个骑士,把"注意力"分摊到各层。
- 现代企业:CEO 的认知带宽有限,所以有 VP、Director、Manager------每层管理者只关注大约 5--8 个直接下属。
Subagent 架构只是把同样的逻辑搬到了 AI 系统里。
真实案例
以我自己搭的 AI 日报工作流为例,简化后的结构长这样:
Step 1:数据采集(主 Agent 自己跑脚本)
Step 2:撰写 Newsletter 草稿(主 Agent 自己写)
Step 3:启动 @newsletter-editor(专门负责内容审查和修改的 Subagent),传入草稿路径,等修改完成
Step 4:同时启动 @twitter-formatter(专门负责转换为 Twitter Thread 格式的 Subagent)
和 @wechat-formatter(专门负责转换为微信公众号格式的 Subagent),
各自传入 newsletter 路径(单条消息并行调用,等全部完成后继续)
Step 5:提交发布
在 Claude Code 里,
@agent-name是启动一个 Subagent 的语法。
对照上面的表格逐行验证:
- 员工只知道自己负责的那块 :
@newsletter-editor只收到草稿路径,@twitter-formatter只收到 newsletter 路径,它们都对主流程一无所知。 - 多个员工并行工作:Step 3 的两个 Subagent 同时启动,互不依赖,总耗时取决于较慢的那个。
- 员工汇报结果,不汇报过程:每个 Subagent 把结果写回文件,主 Agent 只检查输出是否存在,不重放任何中间状态。
整个过程下来,主 Agent 的上下文窗口始终保持干净------它只装自己的规划和各步骤的结论,三个 Subagent 产生的所有中间内容(审查意见、格式转换过程)都在各自的窗口里消化,不会回流污染主流程。
四、用法与边界:什么时候该派活,什么时候别派
任务书写清楚,信息不会自动传递
老板脑子里装着所有背景,但员工入职第一天什么都不知道。你觉得"这还用说"的前提条件,对员工来说可能是盲区。
Subagent 也一样。它启动时只有你给它的任务书,主 Agent 积累的所有上下文不会自动流过去。任务书写得含糊,它不会追问背景------或者追问了也问不到------只能靠猜,然后跑偏。
派活之前,先想清楚:换一个什么都不知道的新员工,拿到这份任务书能不能干?
派活本身有成本
雇人、培训、开会对齐,都需要时间。如果只是确认一个会议时间,发条消息自己问比委托员工问快得多。
Subagent 也有启动延迟,汇报摘要也会损耗细节。任务足够简单的时候,这些成本完全不值得。
什么任务适合派,什么不适合
| 适合派给 Subagent | 不适合 | |
|---|---|---|
| 任务性质 | 模块清晰,边界明确 | 步骤之间高度耦合 |
| 协作方式 | 员工可以自己闷头干完再汇报 | 需要频繁和老板对齐中间状态 |
| 任务规模 | 足够大,值得专人负责 | 太小,管理成本大于执行成本 |
一句话判断标准:这个任务能不能写成一份清晰的任务书,交出去之后不管它,等结果就行? 能,就派;不能,就自己做。