从 Agent 到代码：Claude Code 编排模型的演进

本文灵感来自 riba2534 的这篇推文，文章对 Claude Code 的 Dynamic Workflows 做了详细的分析。本文在此基础上补充两点：一是用一条清晰的演进线把 Agent / Subagent / Skill / Agent Teams / Workflow 串起来，二是用开源项目 bmad-automator 作为"中间态"的活样本来对比。

一句话总结整篇文章

Dynamic Workflows 做的事情，就是把原来主会话里 Claude 的决策逻辑，从"脑子里想的"变成"写在文件里的"，最后变成"机器跑的"。 每一步都是把 Claude 从循环里多退出一层。

Claude Code 编排能力的四层演进

在理解 Workflow 之前，得先看清 Claude Code 现有的几层协作能力是怎么一步步叠加的。

第一层：单会话（Session）

最底层。一个 Claude 实例从头干到尾，串行处理所有任务。你问一句它答一句，工具调用也是排队的。

Claude 的角色：唯一的执行者 + 决策者。

第二层：Subagent

主 Agent 派生出若干小弟去搜文件、读代码、跑命令，干完把结果汇报回来。小弟的生命周期很短，任务结束就消失。

Claude 的角色：决策者 + 调度者。每一步"派谁去干什么"都由 Claude 实时决定，小弟的结果要回到 Claude 的上下文窗口，它读完才能决定下一步。

第三层：Agent Teams

多个独立的 Claude Code 实例像团队一样并行协作，队员之间还能互相通信。适合"开会讨论"式的任务，比如前端和后端同时开工。

Claude 的角色：团队中的一员，但每个成员都有自己的上下文。协调成本随人数上升。

第四层：Dynamic Workflows

这一次 Claude 不再亲自逐轮调度。它先把整个编排过程写成一段 JavaScript 脚本------循环、分支、中间结果的收集全都固化在代码里------再交给一个独立的运行时去执行。

Claude 的角色：脚本作者。写完就"去睡觉"了，只有最终结果才把它叫醒。

这四层的共同瓶颈，以及 Workflow 怎么突破它

前三层有一个共同的瓶颈：编排者始终是 Claude 本身。

它逐轮决策下一步派谁去干什么，每一个 subagent 的返回结果都要回到 Claude 的上下文窗口里。这套机制在任务规模不大时很灵活，可一旦要协调几十上百个并行任务：

上下文窗口装不下那么多中间结果
Claude 的注意力被海量过程信息稀释
编排逻辑是临时的，下次还得重新来

Workflow 换了个思路：脚本自己持有循环、分支和中间结果，Claude 的上下文里只剩下最后那个答案。

用一句话概括这个分工：

JavaScript 运行时当指挥（无脑、确定性），在 agent() 点临时雇 LLM 干活，主 Agent 全程在睡觉，只在最后被叫醒读结果。

bmad-automator：第二层的"标准化版本"

在理解了这条演进线之后，开源项目 bmad-automator 提供了一个"中间态"样本。

它是什么

bmad-automator 是一个 BMAD（AI 驱动的敏捷开发方法论）的编排工具，自动化了 story 的完整开发循环：

复制代码

创建故事 → 实现故事 → (可选) 测试生成 → 对抗性代码审查 → 提交验证 → 触发回顾

它的编排模型

核心循环是：

复制代码

Claude (编排者) → spawn tmux 子会话 (subagent) → 读回监控结果 → 决定下一步 → 再 spawn

具体来说：

编排者：Claude 自身，按预定义的 step 文件（markdown）逐步执行
子任务 ：通过 tmux spawn 独立的 Claude 或 Codex 会话
状态管理 ：markdown state doc + sprint-status.yaml
验证门控：review 完成不靠子任务退出判断，而是验证 sprint-status 的实际状态

它在演进线上的位置

bmad-automator 停在第二层------subagent 的标准化封装。它做了两件有价值的事：

把 subagent 的使用方式标准化：不是每次临场让 Claude 现想怎么派活，而是预定义好了步骤、状态格式、监控协议
做成可复用的 skill 插件：安装后一条命令就能跑整个 BMAD story 循环

但它本质上还是 Claude 自己在当运行时------读 step 文件、spawn tmux、等结果、更新状态，每一步 Claude 都"醒着"。

三种编排模型的直接对比

把 bmad-automator 放进对比表格里，三种模型放在一起比较：

维度	bmad-automator (Subagent+)	Dynamic Workflows	纯 Agent Teams
编排者	Claude 自身（按 step 文件执行）	JS 运行时（无脑确定性执行）	多个 Claude 实例协作
控制流载体	Markdown step 文件 + Python CLI	图灵完备的 JavaScript	Claude 的实时决策
子任务执行	tmux 独立会话	`agent()` spawn subagent	团队成员各自工作
中间结果	回到编排者上下文	留在脚本变量里，不回主上下文	各成员各自持有
可跨会话恢复	支持（state doc 持久化）	不支持（退出后从头跑）	不支持
可复用性	安装为 skill 插件	存为 `/slash-command`	无
适用场景	标准化的固定流水线	一次性大规模并行任务	需要讨论协作的任务
混合 agent	同一编排里混用 Claude/Codex	所有 subagent 同模型	每个成员独立配置

关键洞察：Dynamic Workflows 的本质

看到这里，结论已经很清楚了：

Dynamic Workflows 不是什么新发明，它是把主会话里 Claude 本来就在做的事，变成了代码。

演进路径：

纯 agent：Claude 临场发挥，每轮自己决定怎么走
标准化 subagent （bmad-automator）：把流程写成 step 文件，Claude 按步骤执行------还是 Claude 当运行时，只是不再临场发挥
Dynamic Workflow ：把同样的流程写成 JS------换 JS 运行时执行，Claude 彻底退出

每一步做的事情都一样：编排任务、派发子任务、收集结果、决定下一步。区别只在于谁来干这件事。

第 1 步：Claude 的脑子
第 2 步：Claude 的脑子 + step 文件当指南
第 3 步：JS 运行时，Claude 只在节点内部干活

那 bmad-automator 还有价值吗？

当然有。它解决的是 Dynamic Workflows 还没解决的问题：

跨会话持久化：state doc 写在磁盘上，退出 Claude Code 后下次能 resume。Workflow 目前做不到。
领域专用优化：不需要每次让 Claude 现编编排脚本，BMAD 的流程已经固化和测试过了。
混合 agent 支持：同一个编排里可以根据任务复杂度混用 Claude 和 Codex，Workflow 目前所有 subagent 用同一个模型。
验证门控 ：review 完成不是靠子任务退出判断，而是验证 sprint-status.yaml 的实际状态------这种领域知识不容易被通用编排引擎自动处理。

但它也面临一个天然的扩展性问题：所有中间结果都回到编排者上下文。当 story 数量多、子任务输出大时，编排者 Claude 的上下文会被撑满------这正是 Dynamic Workflows 要解决的问题。

两个绕不开的问题

把编排逻辑从 Claude 脑子里搬到代码里，换来的是可扩展性和上下文效率。但这个 tradeoff 有两面，两个问题必须直面。

问题一：脚本是 agent 写的，会不会有 bug？

当然会。 riba2534 在自己的实践案例里就踩了------第一次跑直接报 TypeError: undefined is not an object，路径没传对。

Workflow 目前的应对手段都是"事后补救"：

脚本可见可编辑 ：跑之前能审，跑的时候 Ctrl+G 能打开改
journal 缓存 + resumeFromRunId：改完重跑，前面跑对的部分不重跑，不重复花钱
schema 自动校验 ：agent() 可以配 schema，输出不匹配会自动重试

但这些手段本质上都是靠人来兜底。脚本写得对不对，取决于 Claude 那一次生成的质量。在复杂流程里，循环条件写错、分支遗漏、schema 定义不精确------这些都是真实的 bug 来源。

相比之下，bmad-automator 的 step 文件不存在这个问题。Step 文件是人写好、测试过、固化下来的，Claude 只是机械执行，不负责发明编排逻辑。你不会因为"Claude 今天状态不好"就拿到一个有 bug 的编排流程。

问题二：流程写死了，agent 执行报错怎么办？

这是更根本的问题。

在原来的主会话模式里，Claude 是个实时决策者：

子任务失败了 → Claude 看报错 → 调整方案 → 换个思路重试
发现预料之外的情况 → Claude 临时改计划
某个环节走不通 → Claude 可以回退、换路、甚至放弃

这种"临场应变"能力，在 Workflow 里被 JS 运行时的确定性替代了。脚本只能执行预定义的逻辑。

当然，JS 本身能写 retry、try-catch、while 循环，比如那个"一直找 bug 直到连续两轮没有新增"的循环模式。但这只能处理你预见到的失败模式。没预见到的呢？脚本就卡住了，要么挂掉，要么等你人工介入。

这是"确定性编排"和"灵活应变"之间的根本 tradeoff：

	Subagent 模式	Dynamic Workflow	bmad-automator
编排灵活性	高（Claude 实时调整）	低（只能跑预定义逻辑）	中（固定流程 + Claude 有限应变）
可扩展性	低（上下文会爆）	高（中间结果不回主上下文）	中（受编排者上下文限制）
适应未知失败	能	不能	有限度能
脚本 bug 风险	无（没有脚本）	有（agent 现写）	无（人写且固化）

这也是为什么 bmad-automator 对 BMAD 这种流程高度标准化的场景特别合适------不需要太多临场应变，step 文件已经覆盖了所有正常和异常路径。

最后的判断

riba2534 在文章末尾有一段判断我很认同：

一年之内，这套"模型现写编排脚本、再调度一支 agent 舰队"的打法，会从某一家的研究预览，长成几乎所有 coding agent 的标配。

但我补充一点：标准化的领域流水线（像 bmad-automator）不会消失，它会迁移到 Workflow 的载体上。当 Workflow 支持跨会话恢复和更灵活的 agent 配置时，BMAD 的 step 文件自然会变成一段 JS 脚本------编排逻辑不变，只是运行时从 Claude 换成了 JS。

到那时候，演进就完成了：从 agent 到代码，从临时决策到持久化程序。