GitHub 开源项目解析:revfactory/harness —— Claude Code 的多智能体团队架构工厂

前言:项目简介

随着 Claude Code、Cursor、Codex、GitHub Copilot 等 AI Coding 工具逐渐进入真实开发流程,开发者开始面临一个新问题:

只让 AI 写代码还不够,如何让 AI 像一个工程团队一样分工、协作、审查和交付?

开源项目 revfactory/harness 正是围绕这个问题展开的。它不是一个传统意义上的代码库框架,也不是单个 Agent,而是一个面向 Claude Code 的 "Team-Architecture Factory",即"团队架构工厂"。用户只需要告诉 Claude Code:

复制代码
Build a harness for this project

或者描述自己的业务场景,例如:

复制代码
Build a harness for comprehensive code review.

Harness 就会根据当前项目或领域需求,自动生成一套专用的 Agent Team 和配套 Skills,并将它们写入项目的 .claude/agents/.claude/skills/ 目录中。

**发布时间(v1.0.0):**2026-03-27


一、项目定位:Harness 到底解决什么问题?

在使用 Claude Code 处理复杂项目时,用户常常会遇到以下问题:

  1. 一个 Agent 处理所有任务,职责过重;

  2. 复杂任务缺少稳定分工;

  3. 代码生成、审查、测试、文档之间没有明确协作机制;

  4. 每次都要重新设计 prompt 和工作流;

  5. AI 输出质量不稳定,尤其在复杂任务中容易遗漏边界条件。

Harness 的设计思路是:

复制代码
领域描述
→ 任务类型识别
→ 团队架构设计
→ Agent 定义生成
→ Skill 生成
→ 协作协议编排
→ 验证与测试

这意味着它将 AI 编程从"单 Agent 执行任务"升级为"多 Agent 团队协作"。


二、项目框架设计

从仓库结构看,Harness 的核心非常清晰,主要由插件清单、核心 Skill、参考文档和项目说明组成。

复制代码
harness/
├── .claude-plugin/
│   └── plugin.json
├── skills/
│   └── harness/
│       ├── SKILL.md
│       └── references/
│           ├── agent-design-patterns.md
│           ├── orchestrator-template.md
│           ├── team-examples.md
│           ├── skill-writing-guide.md
│           ├── skill-testing-guide.md
│           └── qa-agent-guide.md
├── docs/
├── README.md
├── README_KO.md
├── README_JA.md
├── CHANGELOG.md
├── CONTRIBUTING.md
└── LICENSE

1. .claude-plugin/plugin.json:插件元信息

该文件定义了插件名称、版本、作者、协议、关键词和项目描述。

其中最核心的描述是:

复制代码
The team-architecture factory for Claude Code

也就是说,Harness 是一个 Claude Code 插件,专门用于把领域描述转化为 Agent Team 与 Skills。

关键词中包含:

复制代码
agent-team
skill-architect
meta-skill
orchestration
multi-agent
pipeline
fan-out-fan-in
expert-pool
producer-reviewer
supervisor
hierarchical-delegation

这些关键词基本概括了项目的核心能力:多 Agent、技能生成、团队编排和架构模式。


2. skills/harness/SKILL.md:核心元技能

SKILL.md 是 Harness 的核心逻辑文件。它不是普通技能,而是一个"元技能"。

普通 Skill 解决具体问题,例如写文档、审查代码、生成测试;而 Harness 这个 Skill 的作用是生成其他 Agent 和 Skills。

可以理解为:

复制代码
普通 Skill:完成一个任务
Harness:生成完成任务所需的 Agent 团队和 Skill 系统

它的工作流程包括:

复制代码
Phase 0:现状审计
Phase 1:领域分析
Phase 2:团队架构设计
Phase 3:Agent 定义生成
Phase 4:Skill 生成
Phase 5:集成与编排
Phase 6:验证与测试
Phase 7:运行后的演化维护

这使 Harness 更像一个"AI 团队架构师"。


3. references/:架构模板与方法论资料

references/ 目录是项目知识库,主要包含:

文件 作用
agent-design-patterns.md 6 种 Agent 团队架构模式说明
orchestrator-template.md 团队/子代理编排模板
team-examples.md 真实团队配置示例
skill-writing-guide.md Skill 编写方法
skill-testing-guide.md Skill 测试与评估方法
qa-agent-guide.md QA Agent 集成指南

这些文件决定了 Harness 的工程质量。它不是简单写几个 prompt,而是把 Agent 团队设计方法、技能编写规范、测试验证方法都整理成了可复用模板。


三、核心架构:6 种 Agent Team 模式

Harness 最重要的能力是内置了 6 种团队架构模式。

1. Pipeline:流水线模式

适用于强依赖的顺序任务。

例如:

复制代码
需求分析 → 方案设计 → 代码实现 → 测试验证 → 文档生成

每个 Agent 负责一个阶段,前一阶段的结果作为后一阶段的输入。

适合场景:

  • 全栈开发;

  • 文档生成;

  • 数据处理流程;

  • 迁移任务;

  • 复杂工程任务拆解。


2. Fan-out/Fan-in:并行分发与汇总模式

适用于可以并行分析的问题。

例如代码审查场景:

复制代码
架构审查 Agent
安全审查 Agent
性能审查 Agent
测试审查 Agent
代码风格审查 Agent
        ↓
汇总 Agent 输出统一报告

这种模式的优势是提升覆盖面,避免单 Agent 审查视角过窄。

适合场景:

  • 代码审查;

  • 论文调研;

  • 竞品分析;

  • 多角度风险评估;

  • 多模块并行检查。


3. Expert Pool:专家池模式

适用于任务类型不固定,需要按需调用不同专家的场景。

例如一个复杂项目中可能需要:

复制代码
数据库专家
前端专家
后端专家
安全专家
DevOps 专家
测试专家

Supervisor 或 Orchestrator 根据当前问题选择合适的专家,而不是每次都让所有 Agent 参与。

适合场景:

  • 大型项目维护;

  • 多技术栈系统;

  • 故障排查;

  • 长期工程助手。


4. Producer-Reviewer:生成-审查模式

适用于需要质量控制的产出型任务。

典型流程:

复制代码
Producer Agent 生成初稿
Reviewer Agent 审查问题
Producer Agent 根据反馈修改
Finalizer Agent 输出最终版本

这种模式非常适合防止 AI "一次性生成但质量不可控"的问题。

适合场景:

  • 代码生成;

  • 技术文档;

  • PR 描述;

  • 论文摘要;

  • 产品方案;

  • 测试用例生成。


5. Supervisor:监督者模式

适用于动态任务分配。

一个 Supervisor Agent 负责:

复制代码
理解目标
拆解任务
分配给不同 Agent
跟踪状态
处理失败
合并结果
输出最终答案

这种模式类似真实团队中的技术负责人或项目经理。

适合场景:

  • 长流程项目;

  • 多步骤工程任务;

  • 需求不完全明确的开发任务;

  • 需要动态调整执行路径的复杂任务。


6. Hierarchical Delegation:层级委派模式

适用于规模更大、任务可递归拆解的系统。

例如:

复制代码
总负责人 Agent
├── 前端负责人 Agent
│   ├── UI Agent
│   └── 状态管理 Agent
├── 后端负责人 Agent
│   ├── API Agent
│   └── 数据库 Agent
└── QA 负责人 Agent
    ├── 单元测试 Agent
    └── 集成测试 Agent

这种结构适合大型复杂任务,但也会带来更高的编排成本。

适合场景:

  • 大型系统设计;

  • 多模块项目重构;

  • 企业级软件开发;

  • 复杂研究报告;

  • 多角色内容生产流程。


四、关键功能解析与技术破局

1. 从"写代码"转向"设计 AI 团队"

大多数 AI 编程工具关注的是:

复制代码
用户提出需求 → AI 直接写代码

而 Harness 关注的是:

复制代码
用户提出领域目标 → AI 先搭建团队 → 团队再协作完成任务

这是一种明显的范式变化。

它解决的不是"某段代码怎么写",而是"复杂任务应该由哪些 AI 角色协作完成"。


2. 自动生成 .claude/agents/.claude/skills/

Harness 的输出不是简单文本,而是项目中的 Claude Code 配置资产。

生成后的项目结构类似:

复制代码
your-project/
├── .claude/
│   ├── agents/
│   │   ├── analyst.md
│   │   ├── builder.md
│   │   └── qa.md
│   └── skills/
│       ├── analyze/
│       │   └── SKILL.md
│       └── build/
│           ├── SKILL.md
│           └── references/

这意味着 Harness 生成的结果可以在后续 Claude Code 会话中继续复用,而不是一次性 prompt。


3. Agent 和 Skill 分离

Harness 强调 Agent 与 Skill 分离:

复制代码
Agent:谁来做
Skill:怎么做
Orchestrator:如何协作

这种设计很重要。因为在真实工程中,角色和方法应该分离:

  • 一个 QA Agent 可以复用多个测试 Skill;

  • 一个 Builder Agent 可以调用多个实现 Skill;

  • 一个 Reviewer Agent 可以根据任务使用不同审查模板。

这种结构更接近工程化系统,而不是零散提示词集合。


4. Progressive Disclosure:控制上下文加载

AI Coding 工具的一个常见问题是上下文过载。

如果每个 Agent 一开始就读取所有文档、所有规则、所有模板,会浪费上下文窗口,也会降低推理质量。

Harness 通过 Skill 的 Progressive Disclosure 机制,将主要信息放在 SKILL.md,将更详细的模板、指南和案例放在 references/ 中,按需加载。

这种设计可以减少无关上下文,让 Agent 在需要时再读取细节。


5. 编排协议:让 Agent 之间真正协作

Harness 不只是生成多个 Agent 名字,还会考虑:

  • Agent 之间如何传递数据;

  • 谁负责汇总结果;

  • 谁负责质量检查;

  • 失败时如何处理;

  • 是否使用 Agent Teams;

  • 是否使用 Subagents;

  • 是否采用 Hybrid 模式。

在 Claude Code Agent Teams 模式下,Agent 可以通过 TeamCreateSendMessageTaskCreate 等机制进行协作。

这让多 Agent 不再只是"多个并行 prompt",而是具备团队通信和任务协调的结构。


6. Validation:验证生成的团队是否有效

Harness 的工作流中包含验证阶段,重点包括:

复制代码
触发词是否有效
技能是否能被正确调用
Agent 定义是否完整
团队协作协议是否清晰
有 Skill 与无 Skill 的效果对比
dry-run 测试

这对 AI Agent 工程非常关键。

因为生成 Agent 本身并不难,难的是生成之后是否真的能在项目中稳定触发、稳定协作、稳定产出。


7. Harness 不是固定系统,而是可演化系统

项目的核心 Skill 中强调:Harness 不是固定物,而是会随着执行反馈持续演化。

也就是说,当某个 Agent 不好用、某个 Skill 触发不稳定、某个团队结构不合理时,可以继续让 Harness 审计和修改现有 .claude/agents/.claude/skills/

这让它更像一个长期维护的 AI 工程系统,而不是一次性脚手架。


五、使用教程

1. 前置要求

Harness 当前主要面向 Claude Code,并要求启用 Agent Teams:

复制代码
export CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1

如果没有启用 Agent Teams,也可以使用 Subagents 模式,但 Harness 默认推荐 Agent Teams,因为多个 Agent 之间需要协作、通信和任务协调。


2. 通过 Marketplace 安装

在 Claude Code 中执行:

复制代码
/plugin marketplace add revfactory/harness

然后安装插件:

复制代码
/plugin install harness@harness-marketplace

安装完成后,就可以在 Claude Code 中使用 Harness。


3. 直接作为全局 Skill 安装

如果你不通过插件市场,也可以把项目中的 Skill 拷贝到本地 Claude Code Skills 目录:

复制代码
git clone https://github.com/revfactory/harness.git
cd harness

cp -r skills/harness ~/.claude/skills/harness

这种方式适合想手动查看和修改 Skill 内容的用户。


4. 基础使用方式

进入你的项目目录后,打开 Claude Code,然后输入:

复制代码
Build a harness for this project

或者:

复制代码
Design an agent team for this domain

也可以输入更具体的任务描述:

复制代码
Build a harness for full-stack website development.
The team should handle design, frontend, backend, API, and QA testing.

Harness 会分析你的项目或需求,并生成对应的 Agent Team 与 Skills。


5. 代码审查场景示例

如果你希望为项目生成一个多 Agent 代码审查团队,可以输入:

复制代码
Build a harness for comprehensive code review.
I want parallel agents checking architecture, security vulnerabilities,
performance bottlenecks, testing coverage, and code style,
then merging all findings into a single report.

可能生成的团队结构如下:

复制代码
code-review-supervisor
├── architecture-reviewer
├── security-reviewer
├── performance-reviewer
├── testing-reviewer
└── style-reviewer

输出目录可能如下:

复制代码
.claude/
├── agents/
│   ├── code-review-supervisor.md
│   ├── architecture-reviewer.md
│   ├── security-reviewer.md
│   ├── performance-reviewer.md
│   ├── testing-reviewer.md
│   └── style-reviewer.md
└── skills/
    ├── architecture-review/
    ├── security-review/
    ├── performance-review/
    ├── testing-review/
    └── report-synthesis/

这样后续你就可以让 Claude Code 使用这套专用审查团队来处理 PR、重构和代码质量检查。


6. 技术文档场景示例

如果你希望自动生成 API 文档,可以输入:

复制代码
Build a harness that generates API documentation from this codebase.
Agents should analyze endpoints, write descriptions, generate usage examples,
and review for completeness.

可能生成的团队结构:

复制代码
api-analyzer
doc-writer
example-generator
doc-reviewer
documentation-orchestrator

这种方式比单纯让 AI "帮我写文档"更稳定,因为它拆分了分析、撰写、示例生成和质量审查等环节。


7. 深度研究场景示例

如果用于研究任务,可以输入:

复制代码
Build a harness for deep research.
I need an agent team that can investigate any topic from multiple angles,
including web search, academic sources, community sentiment,
then cross-validate findings and produce a comprehensive report.

可能采用的模式是 Fan-out/Fan-in:

复制代码
academic-research-agent
web-research-agent
community-sentiment-agent
fact-check-agent
report-synthesis-agent

这种结构适合论文调研、竞品分析、技术路线比较等任务。


六、适合哪些用户?

Harness 适合以下用户:

  1. 已经在使用 Claude Code 的开发者;

  2. 需要多 Agent 协作处理复杂任务的团队;

  3. 想把 AI 编程流程工程化、模板化的开发者;

  4. 需要构建专用 AI 工作流的技术负责人;

  5. 关注 Agentic Coding、AI Workflow、Multi-Agent System 的研究者;

  6. 想为项目沉淀 .claude/agents/.claude/skills/ 的团队。

如果你只是偶尔让 AI 写一个小脚本,Harness 可能显得偏重。但如果你的任务涉及长期项目、复杂模块、多角色审查或持续协作,它的价值会更明显。


七、项目优势与不足

优势

第一,定位清晰。

Harness 不和通用 Agent 框架抢定位,它专注于 Claude Code 生态中的团队架构生成。

第二,模式抽象完整。

项目内置 6 种常见团队协作模式,覆盖流水线、并行汇总、专家池、生成审查、监督者、层级委派等典型场景。

第三,输出可复用。

它生成的是 .claude/agents/.claude/skills/ 文件,而不是一次性回答。这使得团队配置可以沉淀到项目中。

第四,适合复杂任务。

对于代码审查、文档生成、研究分析、全栈开发等任务,多 Agent 分工比单 Agent 更容易覆盖完整链路。

第五,重视验证。

项目不仅生成 Agent 和 Skills,还强调触发验证、dry-run 测试、with-skill vs without-skill 对比。

不足

第一,目前官方运行环境主要是 Claude Code。

如果你主要使用 Codex、Cursor 或其他 Agent 平台,需要寻找兼容方案或参考相关移植项目。

第二,上手需要理解 Claude Code 的 Agent Teams 机制。

如果用户不了解 .claude/agents/.claude/skills/、Agent Teams、Subagents 等概念,初次使用会有一定学习成本。

第三,多 Agent 不一定总是更好。

对于简单任务,单 Agent 直接完成可能更高效。Harness 更适合复杂任务、长期项目和团队化协作场景。

第四,生成结果仍然需要人工审查。

Harness 可以生成团队架构,但生成的 Agent 定义和 Skill 内容是否真正适合你的项目,仍需要开发者检查和迭代。


八、总结

revfactory/harness 是一个很有代表性的 Claude Code 插件项目。

它的核心价值不是"让 AI 写一段代码",而是让 AI 帮你设计一套可复用的多 Agent 工程团队。

它把 AI 编程流程从:

复制代码
用户提问 → AI 回答

推进到:

复制代码
用户描述领域 → Harness 生成团队 → Agent 协同执行 → Skill 沉淀复用 → 持续演化

这代表了 AI Coding 的一个重要方向:从单点代码生成,走向多 Agent 协作;从临时 prompt,走向可复用工程资产;从"AI 助手",走向"AI 工程团队"。

对于正在使用 Claude Code 的开发者来说,Harness 非常适合用于:

复制代码
代码审查
文档生成
全栈开发
研究报告
数据管道设计
营销内容生产
复杂项目自动化

如果你正在探索 Agentic Engineering、Claude Code Plugin 或 AI 软件工程自动化,revfactory/harness 是一个值得深入研究的项目。


互动话题

你认为未来 AI 编程最有价值的形态是哪一种?

  1. 单 Agent 快速生成代码;

  2. 多 Agent 分工协作;

  3. AI 自动生成项目级工作流;

  4. 人类负责架构判断,AI 团队负责执行;

  5. 每个项目都拥有自己的专属 AI 工程团队。

欢迎在评论区分享你的观点。

相关推荐
智碳未来科技有限公司1 小时前
工业能源数字化的开源实践:智碳 EMS 技术架构与落地指南
开源·能源·能源管理系统·开源能源管理系统·能碳管理系统·绿色工厂申报
_xaboy2 小时前
开源Vue组件FormCreate通过 JSON 生成TinyVue表单
前端·vue.js·低代码·开源·json·表单设计器
jiayong232 小时前
harness 与 hermes-agent 扩展性、安全与运维
运维·人工智能·安全·ai·架构·智能体·harness
bryant_meng3 小时前
【Claude Code】Claude Code Evolution
人工智能·大模型·vibe coding·claude code
糯米导航3 小时前
飙算工具箱|AI编程工具赋能多模态 AIGC 架构实战
架构·aigc·ai编程
Agent手记3 小时前
电信装维如何智能派单?AI 工程师匹配原理与智能体架构拆解
人工智能·ai·架构
数据库小学妹3 小时前
数据库高可用架构实战:从主从复制到两地三中心的四层演进与避坑
数据库·经验分享·架构·dba
zhangfeng11333 小时前
DeepSeek V4 适配华为昇腾950 难度及开源情况
人工智能·pytorch·python·机器学习·华为·开源