Harness:让 Claude Code 先组队,再开工

当 AI 编程任务变复杂时,一个通用助手很容易被迫扮演所有角色:产品分析师、架构师、实现者、测试工程师、审查者、文档作者。短任务里这没问题,但一旦任务跨模块、跨领域、持续多轮,单个 Agent 的上下文和判断就会变得吃紧。revfactory/harness 的想法是:不要让一个 Agent 硬扛所有事,而是先为项目设计一支领域化 Agent 团队。

它把自己定义为 Claude Code 的 Team-Architecture Factory。用户描述项目领域或说出类似 "build a harness for this project" 的意图后,它会生成适合该项目的 agents 和 skills,并从预设架构模式中选择团队组织方式。也就是说,Harness 不是直接帮你写某个功能,而是帮你搭建"更适合写这个项目的 AI 团队"。

它为什么不是普通插件

普通 AI coding 插件往往提供一组固定命令:写代码、查 bug、做 review、生成测试。Harness 的层级更高。它试图根据你的项目类型生成一套团队结构,再把团队成员和技能写入 .claude/agents/.claude/skills/。换句话说,它不是"一个技能",而是"生成技能和代理的技能"。

README 把它放在 L3 Meta-Factory 层,这个说法有点抽象,但意思很有用:L1 可能是具体工具,L2 可能是跨工具流程,L3 则是生成流程和团队架构的系统。Harness 关心的是"怎样为某个领域构造 Agent 团队",而不是"怎样解决某一个固定任务"。

六种团队架构模式

项目 README 提到六种预设架构:Pipeline、Fan-out/Fan-in、Expert Pool、Producer-Reviewer、Supervisor、Hierarchical Delegation。理解这六种模式,是理解 Harness 的关键。

Pipeline 适合顺序明确的任务,比如"需求分析 -> 设计 -> 实现 -> 测试 -> 文档"。它的好处是阶段清楚,输出可逐步传递。

Fan-out/Fan-in 适合并行探索,比如让多个 Agent 分别研究不同方案,最后汇总选择。它能降低单一路径思维的风险。

Expert Pool 适合领域复杂的项目。比如一个金融系统可能需要安全、数据、后端、合规、前端等不同专家参与。

Producer-Reviewer 适合强调质量的任务。一个 Agent 产出,另一个 Agent 审查,减少自我确认偏差。

Supervisor 适合需要统一协调的任务。监督者负责拆解、分派、检查进度和处理异常。

Hierarchical Delegation 则适合更大规模的任务,把复杂目标逐级拆成子任务,让不同层级的 Agent 承担不同粒度的判断。

工作流:从领域描述到团队落地

README 中的 Workflow 大致分为六个阶段:Domain Analysis、Team Architecture Design、Agent Definition Generation、Skill Generation、Integration & Orchestration、Validation & Testing。

第一阶段是领域分析。系统需要理解项目是什么、任务复杂度在哪里、常见风险是什么、需要哪些专业角色。

第二阶段是团队架构设计。它会判断应该使用哪种团队模式,或者组合哪些模式。比如一个前端重构任务可能适合 Producer-Reviewer,而一个研究型任务可能更适合 Fan-out/Fan-in。

第三阶段生成 Agent 定义。也就是把"安全审查者""后端实现者""测试策略师"这类角色落成 Claude Code 可识别的 agent 文件。

第四阶段生成 Skills。Agent 只有角色还不够,还需要知道何时触发、如何工作、该读哪些上下文、输出什么格式。

第五阶段做编排。多个 Agent 之间要传递数据、处理错误、合并结果,否则团队会变成一堆孤立角色。

第六阶段做验证。项目强调 dry-run、触发验证、with-skill vs without-skill 对比测试,这一点很重要,因为生成出来的团队必须证明自己真的比默认方式更好。

适合的使用场景

Harness 适合任务复杂、角色分工自然存在的项目。比如:

  • 大型代码库重构。
  • 多模块产品开发。
  • 安全审计和修复计划。
  • 数据平台或后端系统设计。
  • 游戏、前端、移动端等需要多角色协作的项目。
  • 需要把团队经验沉淀成 Claude Code agents 和 skills 的长期项目。

如果你的团队已经反复对 AI 说"先让架构师看一下,再让实现者写,再让 reviewer 检查",Harness 的概念就很自然:把这种分工固化下来。

不适合的场景

如果只是改一个小 bug、写一个简单脚本、补一段文案,Harness 可能过重。团队架构本身有成本:要生成、理解、维护,还要确保触发正确。

另外,它明显围绕 Claude Code 生态设计。如果你的主要工作环境不是 Claude Code,可能需要先评估兼容性或寻找类似概念的移植方式。README 中也提到与 Archon、ECC、meta-harness 等邻近项目的关系,这说明它处在一个快速变化的 AI coding 工具生态里。

安装与使用路线

README 提供了 marketplace 安装方式,也支持直接作为 global skill 安装。最适合的上手方式不是先在生产项目里使用,而是在一个中等复杂度的试验项目里运行一次,让它生成 agents 和 skills,然后审查输出。

建议上手步骤:

  1. 选择一个你熟悉的小型或中型项目。
  2. 运行 Harness 生成团队。
  3. 查看生成的 .claude/agents/.claude/skills/
  4. 让默认 Claude Code 和 Harness 团队分别处理同类任务。
  5. 比较任务分解、输出质量、审查深度和上下文使用情况。

如果生成结果过于复杂,就收窄团队;如果角色太泛,就补充领域描述;如果触发不稳定,就调整 skill 描述。

二次开发可以看哪里

仓库本身不大,README、docs/quickstart.mddocs/experimental-dependency.md 是理解项目的主要入口。真正值得研究的是它生成出来的 agent 和 skill 结构,以及六种 architecture pattern 如何映射到不同任务。

如果你想把类似思想迁移到其他 AI coding 环境,重点不是复制文件,而是复制方法:领域分析、团队模式选择、角色定义、技能生成、编排协议、验证对比。

读完后的判断

Harness 代表了 AI coding 的一个明显趋势:从"一个大模型助手"走向"可配置的 AI 工程组织"。当任务足够简单时,单助手最快;当任务足够复杂时,结构本身就是能力。Harness 值得看,正因为它把这种结构显式化了。

来源

相关推荐
kfaino7 小时前
码农的AI翻身(三)你好,我叫 Embedding
后端·ai编程
_山海9 小时前
OpenSpec-基于SDD规格驱动开发
ai编程·vibecoding
唐老板16 小时前
MCP协议实战:从零写个Agent工具
ai编程·mcp
counterxing17 小时前
最近发现一个 Mac 工具,有点像把 Raycast、语音输入法、截图和录屏塞到了一起
macos·ai编程·claude
薛定喵的谔17 小时前
Term Proxy — 用 Tauri 2 打造跨平台终端配置管理工具
electron·ai编程·全栈
小溪彼岸18 小时前
CC Switch可视化管理Skill、提示词、会话
aigc·ai编程
aqi0021 小时前
15天学会AI应用开发(九)利用Chroma持久化向量数据
人工智能·python·大模型·ai编程·ai应用
kfaino1 天前
你好,我叫 Prompt——其实,你一直在给 AI 写程序
后端·openai·ai编程
kfaino1 天前
你好,我叫Token——AI世界里最忙的搬砖工
aigc·openai·ai编程