前言:项目简介
随着 Claude Code、Cursor、Codex、GitHub Copilot 等 AI Coding 工具逐渐进入真实开发流程,开发者开始面临一个新问题:
只让 AI 写代码还不够,如何让 AI 像一个工程团队一样分工、协作、审查和交付?
开源项目 revfactory/harness 正是围绕这个问题展开的。它不是一个传统意义上的代码库框架,也不是单个 Agent,而是一个面向 Claude Code 的 "Team-Architecture Factory",即"团队架构工厂"。用户只需要告诉 Claude Code:
Build a harness for this project
或者描述自己的业务场景,例如:
Build a harness for comprehensive code review.
Harness 就会根据当前项目或领域需求,自动生成一套专用的 Agent Team 和配套 Skills,并将它们写入项目的 .claude/agents/ 与 .claude/skills/ 目录中。
**发布时间(v1.0.0):**2026-03-27
一、项目定位:Harness 到底解决什么问题?
在使用 Claude Code 处理复杂项目时,用户常常会遇到以下问题:
-
一个 Agent 处理所有任务,职责过重;
-
复杂任务缺少稳定分工;
-
代码生成、审查、测试、文档之间没有明确协作机制;
-
每次都要重新设计 prompt 和工作流;
-
AI 输出质量不稳定,尤其在复杂任务中容易遗漏边界条件。
Harness 的设计思路是:
领域描述
→ 任务类型识别
→ 团队架构设计
→ Agent 定义生成
→ Skill 生成
→ 协作协议编排
→ 验证与测试
这意味着它将 AI 编程从"单 Agent 执行任务"升级为"多 Agent 团队协作"。
二、项目框架设计
从仓库结构看,Harness 的核心非常清晰,主要由插件清单、核心 Skill、参考文档和项目说明组成。
harness/
├── .claude-plugin/
│ └── plugin.json
├── skills/
│ └── harness/
│ ├── SKILL.md
│ └── references/
│ ├── agent-design-patterns.md
│ ├── orchestrator-template.md
│ ├── team-examples.md
│ ├── skill-writing-guide.md
│ ├── skill-testing-guide.md
│ └── qa-agent-guide.md
├── docs/
├── README.md
├── README_KO.md
├── README_JA.md
├── CHANGELOG.md
├── CONTRIBUTING.md
└── LICENSE
1. .claude-plugin/plugin.json:插件元信息
该文件定义了插件名称、版本、作者、协议、关键词和项目描述。
其中最核心的描述是:
The team-architecture factory for Claude Code
也就是说,Harness 是一个 Claude Code 插件,专门用于把领域描述转化为 Agent Team 与 Skills。
关键词中包含:
agent-team
skill-architect
meta-skill
orchestration
multi-agent
pipeline
fan-out-fan-in
expert-pool
producer-reviewer
supervisor
hierarchical-delegation
这些关键词基本概括了项目的核心能力:多 Agent、技能生成、团队编排和架构模式。
2. skills/harness/SKILL.md:核心元技能
SKILL.md 是 Harness 的核心逻辑文件。它不是普通技能,而是一个"元技能"。
普通 Skill 解决具体问题,例如写文档、审查代码、生成测试;而 Harness 这个 Skill 的作用是生成其他 Agent 和 Skills。
可以理解为:
普通 Skill:完成一个任务
Harness:生成完成任务所需的 Agent 团队和 Skill 系统
它的工作流程包括:
Phase 0:现状审计
Phase 1:领域分析
Phase 2:团队架构设计
Phase 3:Agent 定义生成
Phase 4:Skill 生成
Phase 5:集成与编排
Phase 6:验证与测试
Phase 7:运行后的演化维护
这使 Harness 更像一个"AI 团队架构师"。
3. references/:架构模板与方法论资料
references/ 目录是项目知识库,主要包含:
| 文件 | 作用 |
|---|---|
agent-design-patterns.md |
6 种 Agent 团队架构模式说明 |
orchestrator-template.md |
团队/子代理编排模板 |
team-examples.md |
真实团队配置示例 |
skill-writing-guide.md |
Skill 编写方法 |
skill-testing-guide.md |
Skill 测试与评估方法 |
qa-agent-guide.md |
QA Agent 集成指南 |
这些文件决定了 Harness 的工程质量。它不是简单写几个 prompt,而是把 Agent 团队设计方法、技能编写规范、测试验证方法都整理成了可复用模板。
三、核心架构:6 种 Agent Team 模式
Harness 最重要的能力是内置了 6 种团队架构模式。
1. Pipeline:流水线模式
适用于强依赖的顺序任务。
例如:
需求分析 → 方案设计 → 代码实现 → 测试验证 → 文档生成
每个 Agent 负责一个阶段,前一阶段的结果作为后一阶段的输入。
适合场景:
-
全栈开发;
-
文档生成;
-
数据处理流程;
-
迁移任务;
-
复杂工程任务拆解。
2. Fan-out/Fan-in:并行分发与汇总模式
适用于可以并行分析的问题。
例如代码审查场景:
架构审查 Agent
安全审查 Agent
性能审查 Agent
测试审查 Agent
代码风格审查 Agent
↓
汇总 Agent 输出统一报告
这种模式的优势是提升覆盖面,避免单 Agent 审查视角过窄。
适合场景:
-
代码审查;
-
论文调研;
-
竞品分析;
-
多角度风险评估;
-
多模块并行检查。
3. Expert Pool:专家池模式
适用于任务类型不固定,需要按需调用不同专家的场景。
例如一个复杂项目中可能需要:
数据库专家
前端专家
后端专家
安全专家
DevOps 专家
测试专家
Supervisor 或 Orchestrator 根据当前问题选择合适的专家,而不是每次都让所有 Agent 参与。
适合场景:
-
大型项目维护;
-
多技术栈系统;
-
故障排查;
-
长期工程助手。
4. Producer-Reviewer:生成-审查模式
适用于需要质量控制的产出型任务。
典型流程:
Producer Agent 生成初稿
Reviewer Agent 审查问题
Producer Agent 根据反馈修改
Finalizer Agent 输出最终版本
这种模式非常适合防止 AI "一次性生成但质量不可控"的问题。
适合场景:
-
代码生成;
-
技术文档;
-
PR 描述;
-
论文摘要;
-
产品方案;
-
测试用例生成。
5. Supervisor:监督者模式
适用于动态任务分配。
一个 Supervisor Agent 负责:
理解目标
拆解任务
分配给不同 Agent
跟踪状态
处理失败
合并结果
输出最终答案
这种模式类似真实团队中的技术负责人或项目经理。
适合场景:
-
长流程项目;
-
多步骤工程任务;
-
需求不完全明确的开发任务;
-
需要动态调整执行路径的复杂任务。
6. Hierarchical Delegation:层级委派模式
适用于规模更大、任务可递归拆解的系统。
例如:
总负责人 Agent
├── 前端负责人 Agent
│ ├── UI Agent
│ └── 状态管理 Agent
├── 后端负责人 Agent
│ ├── API Agent
│ └── 数据库 Agent
└── QA 负责人 Agent
├── 单元测试 Agent
└── 集成测试 Agent
这种结构适合大型复杂任务,但也会带来更高的编排成本。
适合场景:
-
大型系统设计;
-
多模块项目重构;
-
企业级软件开发;
-
复杂研究报告;
-
多角色内容生产流程。
四、关键功能解析与技术破局
1. 从"写代码"转向"设计 AI 团队"
大多数 AI 编程工具关注的是:
用户提出需求 → AI 直接写代码
而 Harness 关注的是:
用户提出领域目标 → AI 先搭建团队 → 团队再协作完成任务
这是一种明显的范式变化。
它解决的不是"某段代码怎么写",而是"复杂任务应该由哪些 AI 角色协作完成"。
2. 自动生成 .claude/agents/ 与 .claude/skills/
Harness 的输出不是简单文本,而是项目中的 Claude Code 配置资产。
生成后的项目结构类似:
your-project/
├── .claude/
│ ├── agents/
│ │ ├── analyst.md
│ │ ├── builder.md
│ │ └── qa.md
│ └── skills/
│ ├── analyze/
│ │ └── SKILL.md
│ └── build/
│ ├── SKILL.md
│ └── references/
这意味着 Harness 生成的结果可以在后续 Claude Code 会话中继续复用,而不是一次性 prompt。
3. Agent 和 Skill 分离
Harness 强调 Agent 与 Skill 分离:
Agent:谁来做
Skill:怎么做
Orchestrator:如何协作
这种设计很重要。因为在真实工程中,角色和方法应该分离:
-
一个 QA Agent 可以复用多个测试 Skill;
-
一个 Builder Agent 可以调用多个实现 Skill;
-
一个 Reviewer Agent 可以根据任务使用不同审查模板。
这种结构更接近工程化系统,而不是零散提示词集合。
4. Progressive Disclosure:控制上下文加载
AI Coding 工具的一个常见问题是上下文过载。
如果每个 Agent 一开始就读取所有文档、所有规则、所有模板,会浪费上下文窗口,也会降低推理质量。
Harness 通过 Skill 的 Progressive Disclosure 机制,将主要信息放在 SKILL.md,将更详细的模板、指南和案例放在 references/ 中,按需加载。
这种设计可以减少无关上下文,让 Agent 在需要时再读取细节。
5. 编排协议:让 Agent 之间真正协作
Harness 不只是生成多个 Agent 名字,还会考虑:
-
Agent 之间如何传递数据;
-
谁负责汇总结果;
-
谁负责质量检查;
-
失败时如何处理;
-
是否使用 Agent Teams;
-
是否使用 Subagents;
-
是否采用 Hybrid 模式。
在 Claude Code Agent Teams 模式下,Agent 可以通过 TeamCreate、SendMessage、TaskCreate 等机制进行协作。
这让多 Agent 不再只是"多个并行 prompt",而是具备团队通信和任务协调的结构。
6. Validation:验证生成的团队是否有效
Harness 的工作流中包含验证阶段,重点包括:
触发词是否有效
技能是否能被正确调用
Agent 定义是否完整
团队协作协议是否清晰
有 Skill 与无 Skill 的效果对比
dry-run 测试
这对 AI Agent 工程非常关键。
因为生成 Agent 本身并不难,难的是生成之后是否真的能在项目中稳定触发、稳定协作、稳定产出。
7. Harness 不是固定系统,而是可演化系统
项目的核心 Skill 中强调:Harness 不是固定物,而是会随着执行反馈持续演化。
也就是说,当某个 Agent 不好用、某个 Skill 触发不稳定、某个团队结构不合理时,可以继续让 Harness 审计和修改现有 .claude/agents/ 与 .claude/skills/。
这让它更像一个长期维护的 AI 工程系统,而不是一次性脚手架。
五、使用教程
1. 前置要求
Harness 当前主要面向 Claude Code,并要求启用 Agent Teams:
export CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1
如果没有启用 Agent Teams,也可以使用 Subagents 模式,但 Harness 默认推荐 Agent Teams,因为多个 Agent 之间需要协作、通信和任务协调。
2. 通过 Marketplace 安装
在 Claude Code 中执行:
/plugin marketplace add revfactory/harness
然后安装插件:
/plugin install harness@harness-marketplace
安装完成后,就可以在 Claude Code 中使用 Harness。
3. 直接作为全局 Skill 安装
如果你不通过插件市场,也可以把项目中的 Skill 拷贝到本地 Claude Code Skills 目录:
git clone https://github.com/revfactory/harness.git
cd harness
cp -r skills/harness ~/.claude/skills/harness
这种方式适合想手动查看和修改 Skill 内容的用户。
4. 基础使用方式
进入你的项目目录后,打开 Claude Code,然后输入:
Build a harness for this project
或者:
Design an agent team for this domain
也可以输入更具体的任务描述:
Build a harness for full-stack website development.
The team should handle design, frontend, backend, API, and QA testing.
Harness 会分析你的项目或需求,并生成对应的 Agent Team 与 Skills。
5. 代码审查场景示例
如果你希望为项目生成一个多 Agent 代码审查团队,可以输入:
Build a harness for comprehensive code review.
I want parallel agents checking architecture, security vulnerabilities,
performance bottlenecks, testing coverage, and code style,
then merging all findings into a single report.
可能生成的团队结构如下:
code-review-supervisor
├── architecture-reviewer
├── security-reviewer
├── performance-reviewer
├── testing-reviewer
└── style-reviewer
输出目录可能如下:
.claude/
├── agents/
│ ├── code-review-supervisor.md
│ ├── architecture-reviewer.md
│ ├── security-reviewer.md
│ ├── performance-reviewer.md
│ ├── testing-reviewer.md
│ └── style-reviewer.md
└── skills/
├── architecture-review/
├── security-review/
├── performance-review/
├── testing-review/
└── report-synthesis/
这样后续你就可以让 Claude Code 使用这套专用审查团队来处理 PR、重构和代码质量检查。
6. 技术文档场景示例
如果你希望自动生成 API 文档,可以输入:
Build a harness that generates API documentation from this codebase.
Agents should analyze endpoints, write descriptions, generate usage examples,
and review for completeness.
可能生成的团队结构:
api-analyzer
doc-writer
example-generator
doc-reviewer
documentation-orchestrator
这种方式比单纯让 AI "帮我写文档"更稳定,因为它拆分了分析、撰写、示例生成和质量审查等环节。
7. 深度研究场景示例
如果用于研究任务,可以输入:
Build a harness for deep research.
I need an agent team that can investigate any topic from multiple angles,
including web search, academic sources, community sentiment,
then cross-validate findings and produce a comprehensive report.
可能采用的模式是 Fan-out/Fan-in:
academic-research-agent
web-research-agent
community-sentiment-agent
fact-check-agent
report-synthesis-agent
这种结构适合论文调研、竞品分析、技术路线比较等任务。
六、适合哪些用户?
Harness 适合以下用户:
-
已经在使用 Claude Code 的开发者;
-
需要多 Agent 协作处理复杂任务的团队;
-
想把 AI 编程流程工程化、模板化的开发者;
-
需要构建专用 AI 工作流的技术负责人;
-
关注 Agentic Coding、AI Workflow、Multi-Agent System 的研究者;
-
想为项目沉淀
.claude/agents/和.claude/skills/的团队。
如果你只是偶尔让 AI 写一个小脚本,Harness 可能显得偏重。但如果你的任务涉及长期项目、复杂模块、多角色审查或持续协作,它的价值会更明显。
七、项目优势与不足
优势
第一,定位清晰。
Harness 不和通用 Agent 框架抢定位,它专注于 Claude Code 生态中的团队架构生成。
第二,模式抽象完整。
项目内置 6 种常见团队协作模式,覆盖流水线、并行汇总、专家池、生成审查、监督者、层级委派等典型场景。
第三,输出可复用。
它生成的是 .claude/agents/ 和 .claude/skills/ 文件,而不是一次性回答。这使得团队配置可以沉淀到项目中。
第四,适合复杂任务。
对于代码审查、文档生成、研究分析、全栈开发等任务,多 Agent 分工比单 Agent 更容易覆盖完整链路。
第五,重视验证。
项目不仅生成 Agent 和 Skills,还强调触发验证、dry-run 测试、with-skill vs without-skill 对比。
不足
第一,目前官方运行环境主要是 Claude Code。
如果你主要使用 Codex、Cursor 或其他 Agent 平台,需要寻找兼容方案或参考相关移植项目。
第二,上手需要理解 Claude Code 的 Agent Teams 机制。
如果用户不了解 .claude/agents/、.claude/skills/、Agent Teams、Subagents 等概念,初次使用会有一定学习成本。
第三,多 Agent 不一定总是更好。
对于简单任务,单 Agent 直接完成可能更高效。Harness 更适合复杂任务、长期项目和团队化协作场景。
第四,生成结果仍然需要人工审查。
Harness 可以生成团队架构,但生成的 Agent 定义和 Skill 内容是否真正适合你的项目,仍需要开发者检查和迭代。
八、总结
revfactory/harness 是一个很有代表性的 Claude Code 插件项目。
它的核心价值不是"让 AI 写一段代码",而是让 AI 帮你设计一套可复用的多 Agent 工程团队。
它把 AI 编程流程从:
用户提问 → AI 回答
推进到:
用户描述领域 → Harness 生成团队 → Agent 协同执行 → Skill 沉淀复用 → 持续演化
这代表了 AI Coding 的一个重要方向:从单点代码生成,走向多 Agent 协作;从临时 prompt,走向可复用工程资产;从"AI 助手",走向"AI 工程团队"。
对于正在使用 Claude Code 的开发者来说,Harness 非常适合用于:
代码审查
文档生成
全栈开发
研究报告
数据管道设计
营销内容生产
复杂项目自动化
如果你正在探索 Agentic Engineering、Claude Code Plugin 或 AI 软件工程自动化,revfactory/harness 是一个值得深入研究的项目。
互动话题
你认为未来 AI 编程最有价值的形态是哪一种?
-
单 Agent 快速生成代码;
-
多 Agent 分工协作;
-
AI 自动生成项目级工作流;
-
人类负责架构判断,AI 团队负责执行;
-
每个项目都拥有自己的专属 AI 工程团队。
欢迎在评论区分享你的观点。