作者:戴靖泽(静择)
本文整理自 DataWhale x HiClaw 直播分享,聊聊多 Agent 协作背后的工程思考。
你有没有试过让一个 AI 同时写前端和后端?聊到后面它把自己定好的 API 接口格式给忘了,前后端对不上,还得回头改。等它写完前端才能开始后端,整个过程非常线性。
这不是 AI 不够聪明,是我们用错了方式。HiClaw 的思路是让多个 AI Agent 在聊天室里像团队一样协作。你说需求,Manager 拉人、分活、盯进度,Worker 并行交付。
【限时领】👇
关注「阿里云云原生」公众号,后台回复:0328
免费领 HiClaw 公开课 PPT
为什么你需要一个 AI 团队?
想做一个完整的 Web 应用,需要有人写前端、有人写后端、有人做测试、有人写文档。全让一个 AI 来干,就像一个人同时做四份工作。
单 Agent 的痛点很具体:上下文爆炸,聊着聊着 AI 就忘了前面说的什么了;串行排队,前端没做完后端只能等着;成本浪费,查个资料也得用最贵的模型。

多 Agent 的思路很直接:一个 Manager 负责管理,下面多个 Worker 各司其职。Alice 做前端,Bob 做后端,Carol 做测试,同时开工,互不干扰。每个 Worker 有独立上下文,不会互相污染,而且可以用不同的模型,写代码的用 Opus,查资料的用 Haiku,成本能省 60% 到 80%。
软件工程里早就有答案了,就是分工协作。人类团队不会让一个人干所有事,AI 团队也不应该。
HiClaw 整体架构
一句话概括:你的 AI 团队在聊天室里。

架构分三层。最上面是用户和 LLM 服务。中间是 Manager 容器,包含 Higress AI 网关(流量入口 + 密钥保管)、Tuwunel Matrix 服务器(自建 IM)、MinIO(文件共享)、Element Web(聊天客户端)和 Manager Agent(只管理不执行)。最下面是 Worker 容器群,每个 Worker 独立运行,只持有临时 Token,看不到真实密钥。
设计哲学是关注点分离,每个组件职责清晰,可以独立替换。
三个关键设计决策
为什么用容器隔离
为什么要把每个 Worker 放在单独的容器里?因为不隔离会出很实际的问题。

密钥裸奔,所有 Agent 共享 API Key,一个被攻破全部泄漏。prompt injection 攻击已经是现实威胁,共享密钥意味着一个被攻击就全军覆没。互相干扰,一个 Agent 装错了依赖可能导致其他 Agent 全部崩溃。无法清理,npm 缓存、编译产物越积越多。
HiClaw 的做法:每个 Worker 一个容器,独立的文件系统、网络、依赖。出了问题直接销毁重建,状态都存在 MinIO 里,不会丢。
为什么选 Matrix 协议
想让 Agent 同时支持钉钉、飞书、企微、Slack,传统方式是每个渠道单独对接。N 个渠道和 M 个运行时,就需要 N x M 次适配。

HiClaw 在中间加了一层 Matrix 协议,所有渠道桥接到 Matrix,所有运行时只需实现 Matrix 接口。3 个渠道 + 2 个运行时,从 6 次适配降到 5 次,规模越大优势越明显。CoPaw 接入 Matrix 只写了大约 680 行代码,就自动打通了所有消息渠道。
而且 Matrix 是开放协议,可以自建服务器,数据完全在自己手里。
Worker 永远拿不到真实密钥
AI Agent 会主动执行代码、访问网络、读写文件。如果被 prompt injection 攻击了,它可能会把你的密钥发到外部服务器。所以密钥隔离是必须的。

安全模型分三步:真实 Key 只存在 Higress 网关里;网关为每个 Worker 签发 Consumer Token 作为临时通行证;Worker 拿 Token 请求 LLM,网关自动替换成真实密钥再转发。
Worker 从头到尾都看不到真实密钥。某个 Worker 出了问题,撤销它的 Token 就行,就像收回门禁卡,不需要换锁。
Manager 的设计哲学
Manager 不亲自干活,只负责管人。如果又管理又执行,上下文很快就会被代码细节填满,影响管理判断。

它能创建 Worker(十几秒自动完成注册、配权限、启容器)、拆解分配任务(根据任务类型分配给合适的 Worker 并行执行)、Heartbeat 巡检(每小时检查 Worker 状态)、自动管理项目群。
再说成本。写代码用 Opus/Sonnet,Code Review 用 Sonnet/Qwen,查资料用 Haiku/Flash。10 个任务里可能只有 2 个真正需要 Opus,成本能省 60% 以上。换成通义千问或 DeepSeek,还能再降一个数量级。
HiClaw vs OpenClaw
OpenClaw 是一个很强的单 Agent 运行时,HiClaw 在它基础上加了一层协作和管理的能力。OpenClaw 是优秀的员工,HiClaw 是把这些员工组织起来的公司,HiClaw底层的员工可以基于各种运行时比如 CoPaw,ZeroClaw 等。
| 维度 | OpenClaw | HiClaw |
|---|---|---|
| 部署方式 | 单进程,手动管理环境 | 分布式容器,一键启动 |
| 创建 Agent | 手动配置 + 重启 | 聊天里说一句话就创建 |
| 密钥管理 | Agent 持有真实 Key | Worker 只有 Consumer Token |
| 人类可见性 | 翻日志才能看 | 聊天室全透明 |
| 进度监控 | 无内置监控 | Heartbeat 定时巡检 |
踩坑指南:来自 GitHub Issues 的经验
安装类
- Docker 拉不下来镜像?脚本会自动选最近镜像源,也可以配阿里云加速器。
- Manager 启动超时一般是内存不足,需要 4GB 以上。
- Mac M 系列芯片需要 Docker Desktop 4.39.0+,Windows 需要 WSL2。
使用类
- Worker 没反应?先查 LLM API Key 配置,去 Higress Console 检查路由。
- 群聊里必须 @Worker 才会回复,私聊则每条消息都会触发。
- 一直显示"正在输入"是正常的,复杂任务可能需要几分钟。
- 卡住了让 Manager 做一次 Heartbeat 检查。
配置类
- 支持所有 OpenAI 兼容接口的 LLM。
- Worker 运行时除了 OpenClaw(500MB)还可以用 CoPaw(150MB)。
- 接入钉钉、飞书、企微编辑配置文件即可,社区有现成的 Matrix Bridge。
- 8GB 内存建议 Manager 用 OpenClaw,Worker 用 CoPaw,可以同时跑 3-4 个。
写在最后
容器隔离保安全,Matrix 统一通信,聊天室做透明协作,网关集中管密钥,Manager 和 Worker 分工。说到底就一件事:用成熟的工程实践来解决 AI 协作中的新问题。
一条命令就能跑起来:
macOS / Linux:
less
bash <(curl -sSL https://higress.ai/hiclaw/install.sh)
Windows (PowerShell 5+):
php
Set-ExecutionPolicy Bypass -Scope Process -Force; $wc=New-Object Net.WebClient; $wc.Encoding=[Text.Encoding]::UTF8; iex $wc.DownloadString('https://higress.ai/hiclaw/install.ps1')
- GitHub:github.com/alibaba/hiclaw
- 社区:可搜索群号:167365014834 加入钉钉群
【限时领】👇
关注「阿里云云原生」公众号,后台回复:0328
免费领 HiClaw 公开课 PPT
如果你觉得 HiClaw 有用,欢迎 Star ⭐ 和贡献代码。