我把Hermes里23个Agent全切到GLM-5.1:执行力比GPT强,但有个硬伤

大家好,我是孟健。

今天我的23个AI Agent全部从GPT切到了智谱GLM-5.1。一天下来:建了一个完整站点、搭通了多Agent协作流水线、调了15个session跑了1556条消息。没崩,没傻,比GPT少废话。

但有一个坑,是真的痛。


01 为什么要换?

我跑的是Hermes Agent------一个开源的AI Agent框架,支持多平台(Telegram/Discord/CLI)、多模型切换、多Agent并行。我的团队有23个Agent,各有分工:写公众号的墨微、做增长调研的墨探、出PRD的墨策、搞SEO的墨引、写代码的墨界......

之前全部跑在GPT上。说实话,能力没问题,但两个事让我烦:

一是贵。 23个Agent同时在线,每天早晚报、定时任务、突发协作,Token消耗飞快。

二是啰嗦。 GPT系列有个毛病------它太"热心"了。你让它改个配置文件,它先给你解释一遍为什么要改,再解释怎么改,最后还要总结一下改了什么。23个Agent都这么干,效率直接打折。

所以当智谱放出GLM-5.1的编程API,我直接把所有Agent的默认模型切了过去。


02 切换过程:改一行配置

Hermes的模型切换极其简单。全局配置在~/.hermes/config.yaml,改两行:

yaml 复制代码
model:
  default: glm-5.1
  provider: zai
  base_url: https://open.bigmodel.cn/api/coding/paas/v4

然后用脚本把23个Agent的profile全部同步:

bash 复制代码
# 一键同步所有profile的config.yaml
for profile in ~/.hermes/profiles/*/; do
  cp ~/.hermes/config.yaml "${profile}config.yaml"
done

重启gateway,完事。

从改配置到全部Agent上线,5分钟。


03 实测:GLM-5.1跑Agent到底行不行?

今天跑了一整天,核心干了三件事:

1)从零搭建Hermes Agent 101站点

我让小墨(我的主Agent)独立完成一个面向新手的入门指南站点。它自己研究了Hermes的GitHub仓库、Release Notes、官方文档,然后:

  • 写了一个完整的单页应用(index.html,30KB纯手写)
  • 包含Hero区、9大核心能力卡片、7天入门路径、OpenClaw迁移指南、FAQ
  • 配好SEO(sitemap、robots.txt、llms.txt、Schema.org结构化数据)
  • 一键部署到Cloudflare Pages

站点已上线:hermes101.pages.dev

全程我没写一行代码。 小墨用GLM-5.1跑了172条消息,自主完成。

2)调通多Agent串行流水线

这才是今天的重头戏。

先补个背景:Telegram里Bot默认是看不到其他Bot消息的。 这是平台一直以来的限制,导致多Bot协作几乎不可能做。直到Telegram在@BotFather里加了一个开关------Bot-to-Bot Communication Mode ,允许Bot通过 @OtherBot 提及或者reply的方式互相通信。今年4月3日的Bot API 9.6又把Managed Bots(让Bot创建和管理其他Bot)整套agentic能力放了出来。

也就是说,多Bot协作这个事,是这阵子才真正能跑通的。

我把23个Agent的Bot-to-Bot Mode全部打开,加到一个共享Telegram群里。验证通信链路:

通了。然后开始搭流水线。

之前23个Agent在群里各干各的,缺一个"串起来"的机制。比如做站,应该是:调研→PRD→预算→合规→SEO策略→设计→开发→部署→验收→推广,每一步依赖上一步的产出。

今天搭了一套Pipeline回调机制:

  1. 小墨创建Pipeline(JSON状态文件),自动派发Step 1给墨探
  2. 墨探完成后@hermes_xiaomo_bot /pipeline-done hermes101-site step-1
  3. 小墨收到回调,标记done,自动派发Step 2给墨策
  4. 依次推进,直到10步全部完成

这条流水线调通了。10个Agent串行协作,像工厂流水线一样自动推进。

3)排查Bot-to-Bot通信的坑

过程中踩了几个真实的坑,GLM-5.1展现了一个让我意外的能力------调试排错

坑1:Bot之间@不了 一开始其他Agent收不到小墨的@提及。GLM-5.1自己去翻了Telegram Bot API文档,发现Telegram已经开放了Bot-to-Bot Communication,但需要用正确的mention entity格式。它自己写脚本用Telegram API发送带mention entity的消息,解决了。

坑2:API Key找不到 某个Agent的gateway报错Provider 'zai' is set but no API key found。GLM-5.1自己去查了Hermes的provider源码,发现zai provider的extra_env_vars会依次查找GLM_API_KEYZAI_API_KEYZ_AI_API_KEY------而profile目录下的.env只有GLM_API_KEY。它把所有profile的key都补齐了。

坑3:ALLOWED_USERS没加Bot ID Bot之间的消息被TELEGRAM_ALLOWED_USERS过滤了。GLM-5.1查出所有23个Bot的ID,一次性加到白名单里。

这三个坑,全程它自己排查、自己修,我只在旁边看着。


04 体感对比:GLM-5.1 vs GPT

用了一天,说几个真实体感:

执行力强。 给它一个任务,它直接干,不废话。改配置就改配置,查日志就查日志,不会先给你讲一段"好的,我来帮你分析一下这个问题"的过场。

调试能力在线。 遇到API报错、配置缺失、权限问题,它能自己追根溯源------翻源码、查环境变量、对比配置差异。这个能力我原本以为只有Claude和GPT-5级别才有。

中文理解好。 毕竟国产模型,中文指令的意图理解更准,特别是涉及配置、路径、环境变量这些中英混杂的场景。

上下文压缩后恢复快。 Hermes有自动context压缩机制,GLM-5.1在压缩后恢复上下文的能力不错,不会像某些模型压缩后直接"失忆"。

但有一个硬伤:并发限制。


05 硬伤:并发rate limit

这是GLM-5.1做Agent最大的问题。

当多个Agent同时跑(比如今天同时有3-4个Agent在处理各自的任务),会触发rate limit。表现是API返回429,Agent卡住等待。

对于单Agent对话场景完全没问题。但多Agent并发是Agent框架的核心能力,这个限制会直接影响团队效率。

目前的应对策略:

  • 错峰调度:定时任务(cron)之间错开10分钟
  • 串行Pipeline:多Agent走流水线而不是并行
  • 加retry:遇到429自动等待重试

但这些是workaround,不是solution。希望智谱尽快放开并发限制。


06 结论:国产模型跑Agent,能用,而且不错

我的判断:GLM-5.1是目前国产模型里跑Agent的第一梯队。

它的优势很明确------执行力强、少废话、中文好、调试能力在线。这些特质对一个需要自主操作终端、浏览器、文件系统的Agent来说,非常关键。

劣势也明确------并发限制。如果你的场景是单Agent或者Agent串行,GLM-5.1完全可以替代GPT。如果是多Agent高频并发,还需要等智谱放开限流。

我现在的策略:日常任务全走GLM-5.1,高并发场景fallback到GPT。 成本直接砍了一半。

国产模型在Agent这个赛道的差距,比大多数人想的要小。


📍 如果你也在用AI Agent做项目,可以试试Hermes。hermes101.pages.dev有完整入门指南。

觉得有用?转给你写代码的朋友。 有问题评论区聊,我每条都看。 你觉得国产模型什么时候能全面替代GPT跑Agent?


👋 我是孟健,前腾讯 T11 / 前字节技术 Leader,现在全职做 AI 编程。

🔥 更多 AI 编程实战:

  • GitHub:@mengjian-github
  • 专栏:AI编程实战

觉得有用?点赞+收藏 就是最大支持 🙏

相关推荐
爱吃的小肥羊2 小时前
2026 最新 Codex 如何使用指南:ChatGPT 订阅、CLI 安装、App 登录全流程
aigc·ai编程
OpenTiny社区3 小时前
重磅预告|OpenTiny 亮相 QCon 北京,共话生成式 UI 最新技术思考
前端·开源·ai编程
小村儿3 小时前
Harness Engineering:为什么你用 AI 越用越累?
前端·后端·ai编程
Bryceee4 小时前
一个本地 AI Agent 是怎么跑起来的
agent·ai编程
该用户已不存在5 小时前
Claude Mythos 发布,强到刚出道就被雪藏?
aigc·ai编程·claude
房贷压不垮的码农5 小时前
5 分钟极速入门:用 Python 和 ChromaDB 体验向量数据库的魅力
ai编程
袋鱼不重6 小时前
Hermes Agent 安装与实战:从安装到与 OpenClaw 全方位对比
前端·后端·ai编程
石工记6 小时前
Agent 应用与图状态编排框架LangGraph
python·ai编程