Harness:让 Claude Code 先组队,再开工

当 AI 编程任务变复杂时,一个通用助手很容易被迫扮演所有角色:产品分析师、架构师、实现者、测试工程师、审查者、文档作者。短任务里这没问题,但一旦任务跨模块、跨领域、持续多轮,单个 Agent 的上下文和判断就会变得吃紧。revfactory/harness 的想法是:不要让一个 Agent 硬扛所有事,而是先为项目设计一支领域化 Agent 团队。

它把自己定义为 Claude Code 的 Team-Architecture Factory。用户描述项目领域或说出类似 "build a harness for this project" 的意图后,它会生成适合该项目的 agents 和 skills,并从预设架构模式中选择团队组织方式。也就是说,Harness 不是直接帮你写某个功能,而是帮你搭建"更适合写这个项目的 AI 团队"。

它为什么不是普通插件

普通 AI coding 插件往往提供一组固定命令:写代码、查 bug、做 review、生成测试。Harness 的层级更高。它试图根据你的项目类型生成一套团队结构,再把团队成员和技能写入 .claude/agents/.claude/skills/。换句话说,它不是"一个技能",而是"生成技能和代理的技能"。

README 把它放在 L3 Meta-Factory 层,这个说法有点抽象,但意思很有用:L1 可能是具体工具,L2 可能是跨工具流程,L3 则是生成流程和团队架构的系统。Harness 关心的是"怎样为某个领域构造 Agent 团队",而不是"怎样解决某一个固定任务"。

六种团队架构模式

项目 README 提到六种预设架构:Pipeline、Fan-out/Fan-in、Expert Pool、Producer-Reviewer、Supervisor、Hierarchical Delegation。理解这六种模式,是理解 Harness 的关键。

Pipeline 适合顺序明确的任务,比如"需求分析 -> 设计 -> 实现 -> 测试 -> 文档"。它的好处是阶段清楚,输出可逐步传递。

Fan-out/Fan-in 适合并行探索,比如让多个 Agent 分别研究不同方案,最后汇总选择。它能降低单一路径思维的风险。

Expert Pool 适合领域复杂的项目。比如一个金融系统可能需要安全、数据、后端、合规、前端等不同专家参与。

Producer-Reviewer 适合强调质量的任务。一个 Agent 产出,另一个 Agent 审查,减少自我确认偏差。

Supervisor 适合需要统一协调的任务。监督者负责拆解、分派、检查进度和处理异常。

Hierarchical Delegation 则适合更大规模的任务,把复杂目标逐级拆成子任务,让不同层级的 Agent 承担不同粒度的判断。

工作流:从领域描述到团队落地

README 中的 Workflow 大致分为六个阶段:Domain Analysis、Team Architecture Design、Agent Definition Generation、Skill Generation、Integration & Orchestration、Validation & Testing。

第一阶段是领域分析。系统需要理解项目是什么、任务复杂度在哪里、常见风险是什么、需要哪些专业角色。

第二阶段是团队架构设计。它会判断应该使用哪种团队模式,或者组合哪些模式。比如一个前端重构任务可能适合 Producer-Reviewer,而一个研究型任务可能更适合 Fan-out/Fan-in。

第三阶段生成 Agent 定义。也就是把"安全审查者""后端实现者""测试策略师"这类角色落成 Claude Code 可识别的 agent 文件。

第四阶段生成 Skills。Agent 只有角色还不够,还需要知道何时触发、如何工作、该读哪些上下文、输出什么格式。

第五阶段做编排。多个 Agent 之间要传递数据、处理错误、合并结果,否则团队会变成一堆孤立角色。

第六阶段做验证。项目强调 dry-run、触发验证、with-skill vs without-skill 对比测试,这一点很重要,因为生成出来的团队必须证明自己真的比默认方式更好。

适合的使用场景

Harness 适合任务复杂、角色分工自然存在的项目。比如:

  • 大型代码库重构。
  • 多模块产品开发。
  • 安全审计和修复计划。
  • 数据平台或后端系统设计。
  • 游戏、前端、移动端等需要多角色协作的项目。
  • 需要把团队经验沉淀成 Claude Code agents 和 skills 的长期项目。

如果你的团队已经反复对 AI 说"先让架构师看一下,再让实现者写,再让 reviewer 检查",Harness 的概念就很自然:把这种分工固化下来。

不适合的场景

如果只是改一个小 bug、写一个简单脚本、补一段文案,Harness 可能过重。团队架构本身有成本:要生成、理解、维护,还要确保触发正确。

另外,它明显围绕 Claude Code 生态设计。如果你的主要工作环境不是 Claude Code,可能需要先评估兼容性或寻找类似概念的移植方式。README 中也提到与 Archon、ECC、meta-harness 等邻近项目的关系,这说明它处在一个快速变化的 AI coding 工具生态里。

安装与使用路线

README 提供了 marketplace 安装方式,也支持直接作为 global skill 安装。最适合的上手方式不是先在生产项目里使用,而是在一个中等复杂度的试验项目里运行一次,让它生成 agents 和 skills,然后审查输出。

建议上手步骤:

  1. 选择一个你熟悉的小型或中型项目。
  2. 运行 Harness 生成团队。
  3. 查看生成的 .claude/agents/.claude/skills/
  4. 让默认 Claude Code 和 Harness 团队分别处理同类任务。
  5. 比较任务分解、输出质量、审查深度和上下文使用情况。

如果生成结果过于复杂,就收窄团队;如果角色太泛,就补充领域描述;如果触发不稳定,就调整 skill 描述。

二次开发可以看哪里

仓库本身不大,README、docs/quickstart.mddocs/experimental-dependency.md 是理解项目的主要入口。真正值得研究的是它生成出来的 agent 和 skill 结构,以及六种 architecture pattern 如何映射到不同任务。

如果你想把类似思想迁移到其他 AI coding 环境,重点不是复制文件,而是复制方法:领域分析、团队模式选择、角色定义、技能生成、编排协议、验证对比。

读完后的判断

Harness 代表了 AI coding 的一个明显趋势:从"一个大模型助手"走向"可配置的 AI 工程组织"。当任务足够简单时,单助手最快;当任务足够复杂时,结构本身就是能力。Harness 值得看,正因为它把这种结构显式化了。

来源

相关推荐
冬奇Lab1 小时前
每日一个开源项目 第124篇:last30days —— 洞察最近30天:跨越信息茧房的 AI Agent 搜索引擎
人工智能·搜索引擎·开源
天丁o1 小时前
开源教程:用飞书长连接把本地 Codex CLI 接入机器人,支持进度心跳和可见过程
机器人·开源·飞书
wuhen_n1 小时前
RAG 入门:检索增强生成核心原理
前端·人工智能·typescript·langchain·ai编程
RuoyiOffice1 小时前
2026 企业定制开发选型:从零开发、低代码、SaaS 与 RuoYi Office 怎么选?
spring boot·uni-app·开源·saas·oa·定制化·ruoyioffice
狗凯之家源码网2 小时前
电商代付系统从零搭建与实战指南
前端·后端·开源
winlife_2 小时前
全程用 AI 做一款商业级手游 · EP0 立项:能做到吗、怎么做、边界在哪
人工智能·unity·ai编程·游戏开发·商业化·mcp·funplay
咖啡星人k2 小时前
MonkeyCode 的 CI/CD 实践:开源项目如何做到每2周稳定发布
ci/cd·开源
一条咸鱼_SaltyFish2 小时前
Agent 工程化避坑指南——从实践看常见反模式
ai·agent·ai编程·memory·obsidian·harness·llm-wiki
浮芷.3 小时前
鸿蒙PC端 TTS 参数配置错误问题详解:参数校验与安全封装
华为·开源·harmonyos·鸿蒙·鸿蒙系统