GitHub 开源项目解析：revfactory/harness —— Claude Code 的多智能体团队架构工厂

前言：项目简介

随着 Claude Code、Cursor、Codex、GitHub Copilot 等 AI Coding 工具逐渐进入真实开发流程，开发者开始面临一个新问题：

只让 AI 写代码还不够，如何让 AI 像一个工程团队一样分工、协作、审查和交付？

开源项目 revfactory/harness 正是围绕这个问题展开的。它不是一个传统意义上的代码库框架，也不是单个 Agent，而是一个面向 Claude Code 的 "Team-Architecture Factory"，即"团队架构工厂"。用户只需要告诉 Claude Code：

复制代码

Build a harness for this project

或者描述自己的业务场景，例如：

复制代码

Build a harness for comprehensive code review.

Harness 就会根据当前项目或领域需求，自动生成一套专用的 Agent Team 和配套 Skills，并将它们写入项目的 .claude/agents/ 与 .claude/skills/ 目录中。

**发布时间(v1.0.0)：**2026-03-27

一、项目定位：Harness 到底解决什么问题？

在使用 Claude Code 处理复杂项目时，用户常常会遇到以下问题：

一个 Agent 处理所有任务，职责过重；
复杂任务缺少稳定分工；
代码生成、审查、测试、文档之间没有明确协作机制；
每次都要重新设计 prompt 和工作流；
AI 输出质量不稳定，尤其在复杂任务中容易遗漏边界条件。

Harness 的设计思路是：

复制代码

领域描述
→ 任务类型识别
→ 团队架构设计
→ Agent 定义生成
→ Skill 生成
→ 协作协议编排
→ 验证与测试

这意味着它将 AI 编程从"单 Agent 执行任务"升级为"多 Agent 团队协作"。

二、项目框架设计

从仓库结构看，Harness 的核心非常清晰，主要由插件清单、核心 Skill、参考文档和项目说明组成。

复制代码

harness/
├── .claude-plugin/
│   └── plugin.json
├── skills/
│   └── harness/
│       ├── SKILL.md
│       └── references/
│           ├── agent-design-patterns.md
│           ├── orchestrator-template.md
│           ├── team-examples.md
│           ├── skill-writing-guide.md
│           ├── skill-testing-guide.md
│           └── qa-agent-guide.md
├── docs/
├── README.md
├── README_KO.md
├── README_JA.md
├── CHANGELOG.md
├── CONTRIBUTING.md
└── LICENSE

1. `.claude-plugin/plugin.json`：插件元信息

该文件定义了插件名称、版本、作者、协议、关键词和项目描述。

其中最核心的描述是：

复制代码

The team-architecture factory for Claude Code

也就是说，Harness 是一个 Claude Code 插件，专门用于把领域描述转化为 Agent Team 与 Skills。

关键词中包含：

复制代码

agent-team
skill-architect
meta-skill
orchestration
multi-agent
pipeline
fan-out-fan-in
expert-pool
producer-reviewer
supervisor
hierarchical-delegation

这些关键词基本概括了项目的核心能力：多 Agent、技能生成、团队编排和架构模式。

2. `skills/harness/SKILL.md`：核心元技能

SKILL.md 是 Harness 的核心逻辑文件。它不是普通技能，而是一个"元技能"。

普通 Skill 解决具体问题，例如写文档、审查代码、生成测试；而 Harness 这个 Skill 的作用是生成其他 Agent 和 Skills。

可以理解为：

复制代码

普通 Skill：完成一个任务
Harness：生成完成任务所需的 Agent 团队和 Skill 系统

它的工作流程包括：

复制代码

Phase 0：现状审计
Phase 1：领域分析
Phase 2：团队架构设计
Phase 3：Agent 定义生成
Phase 4：Skill 生成
Phase 5：集成与编排
Phase 6：验证与测试
Phase 7：运行后的演化维护

这使 Harness 更像一个"AI 团队架构师"。

3. `references/`：架构模板与方法论资料

references/ 目录是项目知识库，主要包含：

文件	作用
`agent-design-patterns.md`	6 种 Agent 团队架构模式说明
`orchestrator-template.md`	团队/子代理编排模板
`team-examples.md`	真实团队配置示例
`skill-writing-guide.md`	Skill 编写方法
`skill-testing-guide.md`	Skill 测试与评估方法
`qa-agent-guide.md`	QA Agent 集成指南

这些文件决定了 Harness 的工程质量。它不是简单写几个 prompt，而是把 Agent 团队设计方法、技能编写规范、测试验证方法都整理成了可复用模板。

三、核心架构：6 种 Agent Team 模式

Harness 最重要的能力是内置了 6 种团队架构模式。

1. Pipeline：流水线模式

适用于强依赖的顺序任务。

例如：

复制代码

需求分析 → 方案设计 → 代码实现 → 测试验证 → 文档生成

每个 Agent 负责一个阶段，前一阶段的结果作为后一阶段的输入。

适合场景：

全栈开发；
文档生成；
数据处理流程；
迁移任务；
复杂工程任务拆解。

2. Fan-out/Fan-in：并行分发与汇总模式

适用于可以并行分析的问题。

例如代码审查场景：

复制代码

架构审查 Agent
安全审查 Agent
性能审查 Agent
测试审查 Agent
代码风格审查 Agent
        ↓
汇总 Agent 输出统一报告

这种模式的优势是提升覆盖面，避免单 Agent 审查视角过窄。

适合场景：

代码审查；
论文调研；
竞品分析；
多角度风险评估；
多模块并行检查。

3. Expert Pool：专家池模式

适用于任务类型不固定，需要按需调用不同专家的场景。

例如一个复杂项目中可能需要：

复制代码

数据库专家
前端专家
后端专家
安全专家
DevOps 专家
测试专家

Supervisor 或 Orchestrator 根据当前问题选择合适的专家，而不是每次都让所有 Agent 参与。

适合场景：

大型项目维护；
多技术栈系统；
故障排查；
长期工程助手。

4. Producer-Reviewer：生成-审查模式

适用于需要质量控制的产出型任务。

典型流程：

复制代码

Producer Agent 生成初稿
Reviewer Agent 审查问题
Producer Agent 根据反馈修改
Finalizer Agent 输出最终版本

这种模式非常适合防止 AI "一次性生成但质量不可控"的问题。

适合场景：

代码生成；
技术文档；
PR 描述；
论文摘要；
产品方案；
测试用例生成。

5. Supervisor：监督者模式

适用于动态任务分配。

一个 Supervisor Agent 负责：

复制代码

理解目标
拆解任务
分配给不同 Agent
跟踪状态
处理失败
合并结果
输出最终答案

这种模式类似真实团队中的技术负责人或项目经理。

适合场景：

长流程项目；
多步骤工程任务；
需求不完全明确的开发任务；
需要动态调整执行路径的复杂任务。

6. Hierarchical Delegation：层级委派模式

适用于规模更大、任务可递归拆解的系统。

例如：

复制代码

总负责人 Agent
├── 前端负责人 Agent
│   ├── UI Agent
│   └── 状态管理 Agent
├── 后端负责人 Agent
│   ├── API Agent
│   └── 数据库 Agent
└── QA 负责人 Agent
    ├── 单元测试 Agent
    └── 集成测试 Agent

这种结构适合大型复杂任务，但也会带来更高的编排成本。

适合场景：

大型系统设计；
多模块项目重构；
企业级软件开发；
复杂研究报告；
多角色内容生产流程。

四、关键功能解析与技术破局

1. 从"写代码"转向"设计 AI 团队"

大多数 AI 编程工具关注的是：

复制代码

用户提出需求 → AI 直接写代码

而 Harness 关注的是：

复制代码

用户提出领域目标 → AI 先搭建团队 → 团队再协作完成任务

这是一种明显的范式变化。

它解决的不是"某段代码怎么写"，而是"复杂任务应该由哪些 AI 角色协作完成"。

2. 自动生成 `.claude/agents/` 与 `.claude/skills/`

Harness 的输出不是简单文本，而是项目中的 Claude Code 配置资产。

生成后的项目结构类似：

复制代码

your-project/
├── .claude/
│   ├── agents/
│   │   ├── analyst.md
│   │   ├── builder.md
│   │   └── qa.md
│   └── skills/
│       ├── analyze/
│       │   └── SKILL.md
│       └── build/
│           ├── SKILL.md
│           └── references/

这意味着 Harness 生成的结果可以在后续 Claude Code 会话中继续复用，而不是一次性 prompt。

3. Agent 和 Skill 分离

Harness 强调 Agent 与 Skill 分离：

复制代码

Agent：谁来做
Skill：怎么做
Orchestrator：如何协作

这种设计很重要。因为在真实工程中，角色和方法应该分离：

一个 QA Agent 可以复用多个测试 Skill；
一个 Builder Agent 可以调用多个实现 Skill；
一个 Reviewer Agent 可以根据任务使用不同审查模板。

这种结构更接近工程化系统，而不是零散提示词集合。

4. Progressive Disclosure：控制上下文加载

AI Coding 工具的一个常见问题是上下文过载。

如果每个 Agent 一开始就读取所有文档、所有规则、所有模板，会浪费上下文窗口，也会降低推理质量。

Harness 通过 Skill 的 Progressive Disclosure 机制，将主要信息放在 SKILL.md，将更详细的模板、指南和案例放在 references/ 中，按需加载。

这种设计可以减少无关上下文，让 Agent 在需要时再读取细节。

5. 编排协议：让 Agent 之间真正协作

Harness 不只是生成多个 Agent 名字，还会考虑：

Agent 之间如何传递数据；
谁负责汇总结果；
谁负责质量检查；
失败时如何处理；
是否使用 Agent Teams；
是否使用 Subagents；
是否采用 Hybrid 模式。

在 Claude Code Agent Teams 模式下，Agent 可以通过 TeamCreate、SendMessage、TaskCreate 等机制进行协作。

这让多 Agent 不再只是"多个并行 prompt"，而是具备团队通信和任务协调的结构。

6. Validation：验证生成的团队是否有效

Harness 的工作流中包含验证阶段，重点包括：

复制代码

触发词是否有效
技能是否能被正确调用
Agent 定义是否完整
团队协作协议是否清晰
有 Skill 与无 Skill 的效果对比
dry-run 测试

这对 AI Agent 工程非常关键。

因为生成 Agent 本身并不难，难的是生成之后是否真的能在项目中稳定触发、稳定协作、稳定产出。

7. Harness 不是固定系统，而是可演化系统

项目的核心 Skill 中强调：Harness 不是固定物，而是会随着执行反馈持续演化。

也就是说，当某个 Agent 不好用、某个 Skill 触发不稳定、某个团队结构不合理时，可以继续让 Harness 审计和修改现有 .claude/agents/ 与 .claude/skills/。

这让它更像一个长期维护的 AI 工程系统，而不是一次性脚手架。

五、使用教程

1. 前置要求

Harness 当前主要面向 Claude Code，并要求启用 Agent Teams：

复制代码

export CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1

如果没有启用 Agent Teams，也可以使用 Subagents 模式，但 Harness 默认推荐 Agent Teams，因为多个 Agent 之间需要协作、通信和任务协调。

2. 通过 Marketplace 安装

在 Claude Code 中执行：

复制代码

/plugin marketplace add revfactory/harness

然后安装插件：

复制代码

/plugin install harness@harness-marketplace

安装完成后，就可以在 Claude Code 中使用 Harness。

3. 直接作为全局 Skill 安装

如果你不通过插件市场，也可以把项目中的 Skill 拷贝到本地 Claude Code Skills 目录：

复制代码

git clone https://github.com/revfactory/harness.git
cd harness

cp -r skills/harness ~/.claude/skills/harness

这种方式适合想手动查看和修改 Skill 内容的用户。

4. 基础使用方式

进入你的项目目录后，打开 Claude Code，然后输入：

复制代码

Build a harness for this project

或者：

复制代码

Design an agent team for this domain

也可以输入更具体的任务描述：

复制代码

Build a harness for full-stack website development.
The team should handle design, frontend, backend, API, and QA testing.

Harness 会分析你的项目或需求，并生成对应的 Agent Team 与 Skills。

5. 代码审查场景示例

如果你希望为项目生成一个多 Agent 代码审查团队，可以输入：

复制代码

Build a harness for comprehensive code review.
I want parallel agents checking architecture, security vulnerabilities,
performance bottlenecks, testing coverage, and code style,
then merging all findings into a single report.

可能生成的团队结构如下：

复制代码

code-review-supervisor
├── architecture-reviewer
├── security-reviewer
├── performance-reviewer
├── testing-reviewer
└── style-reviewer

输出目录可能如下：

复制代码

.claude/
├── agents/
│   ├── code-review-supervisor.md
│   ├── architecture-reviewer.md
│   ├── security-reviewer.md
│   ├── performance-reviewer.md
│   ├── testing-reviewer.md
│   └── style-reviewer.md
└── skills/
    ├── architecture-review/
    ├── security-review/
    ├── performance-review/
    ├── testing-review/
    └── report-synthesis/

这样后续你就可以让 Claude Code 使用这套专用审查团队来处理 PR、重构和代码质量检查。

6. 技术文档场景示例

如果你希望自动生成 API 文档，可以输入：

复制代码

Build a harness that generates API documentation from this codebase.
Agents should analyze endpoints, write descriptions, generate usage examples,
and review for completeness.

可能生成的团队结构：

复制代码

api-analyzer
doc-writer
example-generator
doc-reviewer
documentation-orchestrator

这种方式比单纯让 AI "帮我写文档"更稳定，因为它拆分了分析、撰写、示例生成和质量审查等环节。

7. 深度研究场景示例

如果用于研究任务，可以输入：

复制代码

Build a harness for deep research.
I need an agent team that can investigate any topic from multiple angles,
including web search, academic sources, community sentiment,
then cross-validate findings and produce a comprehensive report.

可能采用的模式是 Fan-out/Fan-in：

复制代码

academic-research-agent
web-research-agent
community-sentiment-agent
fact-check-agent
report-synthesis-agent

这种结构适合论文调研、竞品分析、技术路线比较等任务。

六、适合哪些用户？

Harness 适合以下用户：

已经在使用 Claude Code 的开发者；
需要多 Agent 协作处理复杂任务的团队；
想把 AI 编程流程工程化、模板化的开发者；
需要构建专用 AI 工作流的技术负责人；
关注 Agentic Coding、AI Workflow、Multi-Agent System 的研究者；
想为项目沉淀 .claude/agents/ 和 .claude/skills/ 的团队。

如果你只是偶尔让 AI 写一个小脚本，Harness 可能显得偏重。但如果你的任务涉及长期项目、复杂模块、多角色审查或持续协作，它的价值会更明显。

七、项目优势与不足

优势

第一，定位清晰。

Harness 不和通用 Agent 框架抢定位，它专注于 Claude Code 生态中的团队架构生成。

第二，模式抽象完整。

项目内置 6 种常见团队协作模式，覆盖流水线、并行汇总、专家池、生成审查、监督者、层级委派等典型场景。

第三，输出可复用。

它生成的是 .claude/agents/ 和 .claude/skills/ 文件，而不是一次性回答。这使得团队配置可以沉淀到项目中。

第四，适合复杂任务。

对于代码审查、文档生成、研究分析、全栈开发等任务，多 Agent 分工比单 Agent 更容易覆盖完整链路。

第五，重视验证。

项目不仅生成 Agent 和 Skills，还强调触发验证、dry-run 测试、with-skill vs without-skill 对比。

不足

第一，目前官方运行环境主要是 Claude Code。

如果你主要使用 Codex、Cursor 或其他 Agent 平台，需要寻找兼容方案或参考相关移植项目。

第二，上手需要理解 Claude Code 的 Agent Teams 机制。

如果用户不了解 .claude/agents/、.claude/skills/、Agent Teams、Subagents 等概念，初次使用会有一定学习成本。

第三，多 Agent 不一定总是更好。

对于简单任务，单 Agent 直接完成可能更高效。Harness 更适合复杂任务、长期项目和团队化协作场景。

第四，生成结果仍然需要人工审查。

Harness 可以生成团队架构，但生成的 Agent 定义和 Skill 内容是否真正适合你的项目，仍需要开发者检查和迭代。

八、总结

revfactory/harness 是一个很有代表性的 Claude Code 插件项目。

它的核心价值不是"让 AI 写一段代码"，而是让 AI 帮你设计一套可复用的多 Agent 工程团队。

它把 AI 编程流程从：

复制代码

用户提问 → AI 回答

推进到：

复制代码

用户描述领域 → Harness 生成团队 → Agent 协同执行 → Skill 沉淀复用 → 持续演化

这代表了 AI Coding 的一个重要方向：从单点代码生成，走向多 Agent 协作；从临时 prompt，走向可复用工程资产；从"AI 助手"，走向"AI 工程团队"。

对于正在使用 Claude Code 的开发者来说，Harness 非常适合用于：

复制代码

代码审查
文档生成
全栈开发
研究报告
数据管道设计
营销内容生产
复杂项目自动化

如果你正在探索 Agentic Engineering、Claude Code Plugin 或 AI 软件工程自动化，revfactory/harness 是一个值得深入研究的项目。

互动话题

你认为未来 AI 编程最有价值的形态是哪一种？

单 Agent 快速生成代码；
多 Agent 分工协作；
AI 自动生成项目级工作流；
人类负责架构判断，AI 团队负责执行；
每个项目都拥有自己的专属 AI 工程团队。

欢迎在评论区分享你的观点。

GitHub 开源项目解析：revfactory/harness —— Claude Code 的多智能体团队架构工厂

前言：项目简介

一、项目定位：Harness 到底解决什么问题？

二、项目框架设计

1. .claude-plugin/plugin.json：插件元信息

2. skills/harness/SKILL.md：核心元技能

3. references/：架构模板与方法论资料

三、核心架构：6 种 Agent Team 模式

1. Pipeline：流水线模式

2. Fan-out/Fan-in：并行分发与汇总模式

3. Expert Pool：专家池模式

4. Producer-Reviewer：生成-审查模式

5. Supervisor：监督者模式

6. Hierarchical Delegation：层级委派模式

四、关键功能解析与技术破局

1. 从"写代码"转向"设计 AI 团队"

2. 自动生成 .claude/agents/ 与 .claude/skills/

3. Agent 和 Skill 分离

4. Progressive Disclosure：控制上下文加载

5. 编排协议：让 Agent 之间真正协作

6. Validation：验证生成的团队是否有效

7. Harness 不是固定系统，而是可演化系统

五、使用教程

1. 前置要求

2. 通过 Marketplace 安装

3. 直接作为全局 Skill 安装

4. 基础使用方式

5. 代码审查场景示例

6. 技术文档场景示例

7. 深度研究场景示例

六、适合哪些用户？

七、项目优势与不足

优势

不足

八、总结

互动话题

1. `.claude-plugin/plugin.json`：插件元信息

2. `skills/harness/SKILL.md`：核心元技能

3. `references/`：架构模板与方法论资料

2. 自动生成 `.claude/agents/` 与 `.claude/skills/`