我们发现了一种方法,可以将单个 Claude Code 实例转变为一个自主的软件工程团队------包含项目经理、前端开发、后端开发,所有角色都同时运行,都能遵守截止日期,无需我的干预就能提交代码。
它们不用等我,它们不需要审批,它们不用请求许可。
它们只管构建。
我来给你展示它是如何运作的,以及为什么这可能是 AI 开发的未来。
背景故事:从 AI 辅助工具到自主系统
在过去的一年里,我们见证了 AI 代码辅助工具的快速发展:
-
Cursor 将 VS Code 变成了一个协作助手。
-
Claude Code 为我们提供了真正能理解上下文的智能终端。
-
Agent 驱动的工作流成了热门词汇。
但它们都有一个共同点:仍然需要你点击批准。
而我今天发现的方法彻底颠覆了这一点。我搭建了一个系统,它不仅能运行 Claude Code,还能自主协调多个 Claude agent 并行工作。完全自主运行。
这些 agent 会在不同的终端间协作,检查彼此的工作,遵守严格的时间表,而我完全无需插手。
我来具体给你展示它是如何运作的。
Tmux Orchestrator 究竟能做什么
欢迎了解 Tmux Orchestrator,这是一个能将 Claude Code 转变为一个自主管理、持续运行的软件团队的框架。
它不仅仅是一个巧妙的脚本,它是一个架构框架,能够:
-
全天候(24/7)运行 Claude agent,即便你在睡觉。
-
自主安排检查时间并重新分配工作。
-
协调多个工程师和项目经理处理不同的项目。
-
通过在 tmux 窗口中生成并行团队实现无限扩展。
-
即便是关闭终端或笔记本电脑,工作也能持续进行。
想象一下 Cursor......但它能构建你的应用,无需你全程指导。
如果你还没有在你的设备上设置 Claude Code,那么在运行这个 orchestrator 之前需要先完成设置。
突破:Tmux Orchestrator
这一神奇功能来自一个名为 Tmux Orchestrator 的 GitHub 仓库。这个框架能将你的终端转变为一个自我管理的 AI 开发环境。
它的功能如下:
-
启动一个主 Claude agent。
-
这个主 agent 会在新终端中生成子 agent。
-
每个子 agent 都被分配了特定角色(例如,前端开发、后端项目经理)。
-
agent 会遵循详细的规范并严格遵守时间线。
-
进度会被自动跟踪、提交并设置检查点。
而且,它确实有效。效果非常好。
工作原理:三层 agent 架构
为了克服上下文限制,该 orchestrator 采用了分层 agent 架构:
┌─────────────┐
│ Orchestrator│ ← 你在此处进行交互(一次)
└──────┬──────┘
│ 监控并协调
▼
┌─────────────┐ ┌─────────────┐
│ Project │ │ Project │ ← 分配任务,执行规范
│ Manager 1 │ │ Manager 2 │
└──────┬──────┘ └──────┬──────┘
│ │
▼ ▼
┌─────────────┐ ┌─────────────┐
│ Engineer 1 │ │ Engineer 2 │ ← 编写代码、修复漏洞、运行测试
└─────────────┘ └─────────────┘
每一层都有明确的焦点和清晰的职责,使 agent 保持在可管理的上下文范围内。
-
Orchestrator 监督所有项目
-
Project Manager 执行规范、时间线和协调工作
-
Engineer 编写代码、测试并提交
分步指南:如何构建你自己的AI开发团队
下面我会详细介绍完整的设置过程,以便你亲自尝试。
步骤1:克隆框架
-
导航到你的目标目录。
-
克隆仓库:
git clone github.com/Jedward23/T... cd Tmux-Orchestrator
-
运行提供的设置脚本,使文件可执行。
步骤2:启动新的Tmux会话
创建一个新会话(例如 my-agent)并保持其打开状态。
arduino
tmux new-session -s my-agent
⚠️ Windows用户注意事项
tmux 是基于Unix的终端工具,无法在PowerShell中运行。
要在Windows上使用Tmux Orchestrator,请在WSL(Windows Subsystem for Linux)中运行所有终端命令。
如果尚未设置WSL,请遵循以下官方安装指南:
👉 learn.microsoft.com/en-us/windo...
步骤3:通过关键标志启用自主性(可选)
现在你可以运行Claude Code了。
如果你希望Claude无需等待你的批准即可执行命令,可以将:
claude
替换为:
css
claude --dangerously-skip-permissions

规范文件夹:新的事实来源
为了指导你的agent,你需要创建一个包含多个规范文件的文件夹:
-
main_spec.md:全局概述
-
frontend_spec.md:包含UI参考图像和实施计划
-
backend_spec.md:API设计、数据库模式和逻辑
-
integration_spec.md:团队间各部分如何协同工作
这些文件就像产品需求文档,你的agent会根据它们来构建完整的应用。
你可以让claude帮助你生成这些文件。
以下是一个模板示例:
diff
项目:电子商务结账流程
目标:实现多步骤结账
约束条件:
- 使用现有购物车状态
- 遵循设计系统
- 最多3个API端点
- 每步完成后提交代码
交付成果:
1.带验证的配送表单
2.支付方式选择
3.订单确认页面
4.成功/失败处理
成功标准:
- 表单可验证
- 支付成功
- 数据库存储订单
- 触发邮件发送
你甚至可以指定截止日期和跨团队的资源分配。
你尚未使用的最重要文件:prompt.md
spec.md 文件定义了项目应该是什么样子,而 prompt.md 文件则告诉 orchestrator 如何管理构建过程。
可以把它看作是给你的 AI 项目经理的任务简报。没有它,agent 知道要构建什么,但不知道如何协调。
以下是 prompt.md 的一个示例:
diff
规范文件位于 ~/Projects/EcommApp/Specs。
创建:
- 一个前端团队(项目经理、开发人员、UI 测试人员)
- 一个后端团队(项目经理、开发人员、API 测试人员)
- 一个认证团队(项目经理、开发人员)
日程安排:
- 项目经理每 15 分钟进行一次检查
- 开发人员每 30 分钟提交一次代码
- 每小时进行一次 orchestrator 状态同步
前端和后端立即开始第一阶段。认证团队在第二阶段启动时开始。
你可以通过调整以下内容来编辑自己的 prompt.md:
-
规范文件夹的路径(示例中为 ~/projects/EcommApp/Spec)
-
团队的数量和类型(前端、后端、认证、分析、质量保证等)
-
提交节奏(每 30 分钟一次非常适合 Git 可追溯性)
-
阶段控制(同时启动、交错启动或根据成功情况启动)
然后启动即可。
运行 Claude 后会发生什么:Agent、团队与终端协调
一旦你使用 prompt.md 和规范文件启动了 orchestrator,Claude 就会接管一切,而这正是神奇之处开始的地方。
Claude 接下来会做这些事:
- 解析你的 prompt.md
它会确定要创建哪些团队(例如前端、后端)、规范文件的位置以及如何协调时间。
- 为每个角色启动 tmux 窗口:
-
前端项目经理
-
前端开发人员
-
前端服务器(用于测试/构建)
-
后端项目经理
-
后端开发人员
-
后端服务器
-
Orchestrator(你)
-
共享日志/检查
- 分配职责
每个 agent 会根据规范和 prompt.md 中的指示获得相应工作。
- 所有团队开始第一阶段
如果你要求同时启动,每个团队会立即开始。
- 每 15 分钟安排一次自我检查
这些检查会跟踪进度、审查提交,并在准备就绪时让每个团队进入下一阶段。
一个典型项目在磁盘上的结构可能是这样的。可以把这看作是 Claude 读取的"大脑":
perl
~/Projects/EcommApp/
│
├── prompt.md # 给 orchestrator 的高层指示
├── Specs/
│ ├── main_spec.md # 时间线和全局目标
│ ├── frontend_spec.md # UI 需求、组件、原型
│ ├── backend_spec.md # API 端点、数据库逻辑
│ ├── integration_spec.md # 前端与后端如何协同
│
├── UI_Reference/
│ ├── design.png # 截图或 Figma 导出文件
│ └── implementation.md # 分步 ShadCN 组件计划
│
├── TaskManager/
│ └── (Generated Code) # Claude 会在这里构建你的应用
│
├── Claude_Scripts/
│ ├── send-claude-message.sh
│ ├── schedule_with_note.sh
│ └── tmux_utils.py
重要提示:在 prompt.md 中始终使用绝对路径,这样 Claude 才不会迷路。
而现在,在你的终端中......
当 orchestrator 运行后,你会在 tmux 会话中看到类似这样的内容:
┌───────────────────────────────┐
│ orchestrator:0 │ ← 你(控制塔)
├───────────────────────────────┤
│ frontend-pm:1 │ ← 读取 frontend_spec.md
│ frontend-dev:2 │ ← 构建 UI,推送提交
│ frontend-server:3 │ ← 运行测试,预览 UI
├───────────────────────────────┤
│ backend-pm:4 │ ← 从 backend_spec.md 分配任务
│ backend-dev:5 │ ← 构建 API,修复漏洞
│ backend-server:6 │ ← 运行后端测试,记录结果
├───────────────────────────────┤
│ status-logger:7 │ ← 每 15 分钟检查一次
└───────────────────────────────┘

这些窗格中的每一个都是完全自主的 Claude agent,接收指令、阅读规范、编写代码并报告状态。
这就像有一个配备齐全的快跑团队在你的终端中工作,无需全程指导。
最终思考:编程的未来变得更加奇妙
当我第一次想象自主 AI agent 时,我想的是:总有一天会实现。
而现在?我的终端里正运行着 8 个这样的 agent,它们在编写代码、调试并检查彼此的工作。没有插件,没有 IDE 冗余。只有终端、规范和协同。
这不是开发者的终结。但这确实是某种奇妙事物的开端:以协同方式编写代码。以提示设计实现工程。
工具已就位。未来已然运行。