从 Agent 到代码:Claude Code 编排模型的演进

本文灵感来自 riba2534 的这篇推文,文章对 Claude Code 的 Dynamic Workflows 做了详细的分析。本文在此基础上补充两点:一是用一条清晰的演进线把 Agent / Subagent / Skill / Agent Teams / Workflow 串起来,二是用开源项目 bmad-automator 作为"中间态"的活样本来对比。


一句话总结整篇文章

Dynamic Workflows 做的事情,就是把原来主会话里 Claude 的决策逻辑,从"脑子里想的"变成"写在文件里的",最后变成"机器跑的"。 每一步都是把 Claude 从循环里多退出一层。


Claude Code 编排能力的四层演进

在理解 Workflow 之前,得先看清 Claude Code 现有的几层协作能力是怎么一步步叠加的。

第一层:单会话(Session)

最底层。一个 Claude 实例从头干到尾,串行处理所有任务。你问一句它答一句,工具调用也是排队的。

Claude 的角色:唯一的执行者 + 决策者。

第二层:Subagent

主 Agent 派生出若干小弟去搜文件、读代码、跑命令,干完把结果汇报回来。小弟的生命周期很短,任务结束就消失。

Claude 的角色:决策者 + 调度者。每一步"派谁去干什么"都由 Claude 实时决定,小弟的结果要回到 Claude 的上下文窗口,它读完才能决定下一步。

第三层:Agent Teams

多个独立的 Claude Code 实例像团队一样并行协作,队员之间还能互相通信。适合"开会讨论"式的任务,比如前端和后端同时开工。

Claude 的角色:团队中的一员,但每个成员都有自己的上下文。协调成本随人数上升。

第四层:Dynamic Workflows

这一次 Claude 不再亲自逐轮调度。它先把整个编排过程写成一段 JavaScript 脚本------循环、分支、中间结果的收集全都固化在代码里------再交给一个独立的运行时去执行。

Claude 的角色:脚本作者。写完就"去睡觉"了,只有最终结果才把它叫醒。


这四层的共同瓶颈,以及 Workflow 怎么突破它

前三层有一个共同的瓶颈:编排者始终是 Claude 本身

它逐轮决策下一步派谁去干什么,每一个 subagent 的返回结果都要回到 Claude 的上下文窗口里。这套机制在任务规模不大时很灵活,可一旦要协调几十上百个并行任务:

  • 上下文窗口装不下那么多中间结果
  • Claude 的注意力被海量过程信息稀释
  • 编排逻辑是临时的,下次还得重新来

Workflow 换了个思路:脚本自己持有循环、分支和中间结果,Claude 的上下文里只剩下最后那个答案。

用一句话概括这个分工:

JavaScript 运行时当指挥(无脑、确定性),在 agent() 点临时雇 LLM 干活,主 Agent 全程在睡觉,只在最后被叫醒读结果。


bmad-automator:第二层的"标准化版本"

在理解了这条演进线之后,开源项目 bmad-automator 提供了一个"中间态"样本。

它是什么

bmad-automator 是一个 BMAD(AI 驱动的敏捷开发方法论)的编排工具,自动化了 story 的完整开发循环:

复制代码
创建故事 → 实现故事 → (可选) 测试生成 → 对抗性代码审查 → 提交验证 → 触发回顾

它的编排模型

核心循环是:

复制代码
Claude (编排者) → spawn tmux 子会话 (subagent) → 读回监控结果 → 决定下一步 → 再 spawn

具体来说:

  • 编排者:Claude 自身,按预定义的 step 文件(markdown)逐步执行
  • 子任务 :通过 tmux spawn 独立的 Claude 或 Codex 会话
  • 状态管理 :markdown state doc + sprint-status.yaml
  • 验证门控:review 完成不靠子任务退出判断,而是验证 sprint-status 的实际状态

它在演进线上的位置

bmad-automator 停在第二层------subagent 的标准化封装。它做了两件有价值的事:

  1. 把 subagent 的使用方式标准化:不是每次临场让 Claude 现想怎么派活,而是预定义好了步骤、状态格式、监控协议
  2. 做成可复用的 skill 插件:安装后一条命令就能跑整个 BMAD story 循环

但它本质上还是 Claude 自己在当运行时------读 step 文件、spawn tmux、等结果、更新状态,每一步 Claude 都"醒着"。


三种编排模型的直接对比

把 bmad-automator 放进对比表格里,三种模型放在一起比较:

维度 bmad-automator (Subagent+) Dynamic Workflows 纯 Agent Teams
编排者 Claude 自身(按 step 文件执行) JS 运行时(无脑确定性执行) 多个 Claude 实例协作
控制流载体 Markdown step 文件 + Python CLI 图灵完备的 JavaScript Claude 的实时决策
子任务执行 tmux 独立会话 agent() spawn subagent 团队成员各自工作
中间结果 回到编排者上下文 留在脚本变量里,不回主上下文 各成员各自持有
可跨会话恢复 支持(state doc 持久化) 不支持(退出后从头跑) 不支持
可复用性 安装为 skill 插件 存为 /slash-command
适用场景 标准化的固定流水线 一次性大规模并行任务 需要讨论协作的任务
混合 agent 同一编排里混用 Claude/Codex 所有 subagent 同模型 每个成员独立配置

关键洞察:Dynamic Workflows 的本质

看到这里,结论已经很清楚了:

Dynamic Workflows 不是什么新发明,它是把主会话里 Claude 本来就在做的事,变成了代码。

演进路径:

  1. 纯 agent:Claude 临场发挥,每轮自己决定怎么走
  2. 标准化 subagent (bmad-automator):把流程写成 step 文件,Claude 按步骤执行------还是 Claude 当运行时,只是不再临场发挥
  3. Dynamic Workflow :把同样的流程写成 JS------换 JS 运行时执行,Claude 彻底退出

每一步做的事情都一样:编排任务、派发子任务、收集结果、决定下一步。区别只在于谁来干这件事。

  • 第 1 步:Claude 的脑子
  • 第 2 步:Claude 的脑子 + step 文件当指南
  • 第 3 步:JS 运行时,Claude 只在节点内部干活

那 bmad-automator 还有价值吗?

当然有。它解决的是 Dynamic Workflows 还没解决的问题:

  1. 跨会话持久化:state doc 写在磁盘上,退出 Claude Code 后下次能 resume。Workflow 目前做不到。
  2. 领域专用优化:不需要每次让 Claude 现编编排脚本,BMAD 的流程已经固化和测试过了。
  3. 混合 agent 支持:同一个编排里可以根据任务复杂度混用 Claude 和 Codex,Workflow 目前所有 subagent 用同一个模型。
  4. 验证门控 :review 完成不是靠子任务退出判断,而是验证 sprint-status.yaml 的实际状态------这种领域知识不容易被通用编排引擎自动处理。

但它也面临一个天然的扩展性问题:所有中间结果都回到编排者上下文。当 story 数量多、子任务输出大时,编排者 Claude 的上下文会被撑满------这正是 Dynamic Workflows 要解决的问题。


两个绕不开的问题

把编排逻辑从 Claude 脑子里搬到代码里,换来的是可扩展性和上下文效率。但这个 tradeoff 有两面,两个问题必须直面。

问题一:脚本是 agent 写的,会不会有 bug?

当然会。 riba2534 在自己的实践案例里就踩了------第一次跑直接报 TypeError: undefined is not an object,路径没传对。

Workflow 目前的应对手段都是"事后补救":

  • 脚本可见可编辑 :跑之前能审,跑的时候 Ctrl+G 能打开改
  • journal 缓存 + resumeFromRunId:改完重跑,前面跑对的部分不重跑,不重复花钱
  • schema 自动校验agent() 可以配 schema,输出不匹配会自动重试

但这些手段本质上都是靠人来兜底。脚本写得对不对,取决于 Claude 那一次生成的质量。在复杂流程里,循环条件写错、分支遗漏、schema 定义不精确------这些都是真实的 bug 来源。

相比之下,bmad-automator 的 step 文件不存在这个问题。Step 文件是人写好、测试过、固化下来的,Claude 只是机械执行,不负责发明编排逻辑。你不会因为"Claude 今天状态不好"就拿到一个有 bug 的编排流程。

问题二:流程写死了,agent 执行报错怎么办?

这是更根本的问题。

在原来的主会话模式里,Claude 是个实时决策者

  • 子任务失败了 → Claude 看报错 → 调整方案 → 换个思路重试
  • 发现预料之外的情况 → Claude 临时改计划
  • 某个环节走不通 → Claude 可以回退、换路、甚至放弃

这种"临场应变"能力,在 Workflow 里被 JS 运行时的确定性替代了。脚本只能执行预定义的逻辑

当然,JS 本身能写 retry、try-catch、while 循环,比如那个"一直找 bug 直到连续两轮没有新增"的循环模式。但这只能处理你预见到的失败模式。没预见到的呢?脚本就卡住了,要么挂掉,要么等你人工介入。

这是"确定性编排"和"灵活应变"之间的根本 tradeoff:

Subagent 模式 Dynamic Workflow bmad-automator
编排灵活性 高(Claude 实时调整) 低(只能跑预定义逻辑) 中(固定流程 + Claude 有限应变)
可扩展性 低(上下文会爆) 高(中间结果不回主上下文) 中(受编排者上下文限制)
适应未知失败 不能 有限度能
脚本 bug 风险 无(没有脚本) 有(agent 现写) 无(人写且固化)

这也是为什么 bmad-automator 对 BMAD 这种流程高度标准化的场景特别合适------不需要太多临场应变,step 文件已经覆盖了所有正常和异常路径。


最后的判断

riba2534 在文章末尾有一段判断我很认同:

一年之内,这套"模型现写编排脚本、再调度一支 agent 舰队"的打法,会从某一家的研究预览,长成几乎所有 coding agent 的标配。

但我补充一点:标准化的领域流水线(像 bmad-automator)不会消失,它会迁移到 Workflow 的载体上。当 Workflow 支持跨会话恢复和更灵活的 agent 配置时,BMAD 的 step 文件自然会变成一段 JS 脚本------编排逻辑不变,只是运行时从 Claude 换成了 JS。

到那时候,演进就完成了:从 agent 到代码,从临时决策到持久化程序

相关推荐
Soari1 天前
【功能演进】Claude Code v2.1.153:交互逻辑重大反转,后台 Agent 体验大修
aiagent·claudecode·model逻辑反转
m0_535817552 天前
从0到1上手Claude Code:Windows安装+88api配置全流程
windows·gpt·node.js·claude·claudecode·88api
LSG_Dawn3 天前
ubuntu22.04 部署 claudecode详细步骤
linux·ai编程·claudecode
m0_535817553 天前
Claude Code在Linux/WSL2环境完整部署指南:API中转+避坑配置一篇搞定
linux·服务器·node.js·claude·wsl2·claudecode·88api
拙野5 天前
【保姆级教程】Claude Code无缝集成DeepSeek V4 Pro
java·人工智能·deepseek·claudecode·ai coding
深念Y6 天前
理解大模型API缓存机制:从Claude Code的缓存失效到DeepSeek的硬盘缓存
缓存·ai·api·提示词·kvcache·vibecoding·claudecode
深念Y6 天前
Claude Code 搜索工具失灵,用 MCP + 提示词注入绕过 tavily
网络·搜索引擎·mcp·claudecode·中转站·tavily·搜索服务器
逆境不可逃7 天前
【与我学 ClaudeCode】规划与协调篇 之 Skills:按需加载的领域知识框架
大数据·人工智能·elasticsearch·搜索引擎·agent·claudecode