Hermes为什么开始像基础设施：11万星、RCE修复与生态接入

Hermes 的"成人礼"：11 万星、RCE 修复与生态接入，下一代 Agent 为什么开始像基础设施

一个开源 Agent 项目，凭什么能在同一段时间里，让小米、阿里云、AMD 这些名字同时出现在它的讨论链里？

只靠热度不够。

只靠会调工具也不够。

真正让 Hermes 值得重估的，是它开始同时通过三种完全不同的考试：开源社区的增长考试、工程体系的落地考试、安全事件的压力考试。

截至 4 月 23 日，Hermes Agent 的 GitHub 星标已经来到 11.1 万 。从 3 月 12 日的 v0.2.0 到 4 月 16 日的 v0.10.0 ，官方在 35 天里连续发了 9 个版本 。GitHub contributors 列表也已经超过 500 位。

这不是一个"做着玩"的节奏。

这更像一个项目从明星 demo，开始往基础设施位置拱。

真正值得去看的点，也不只是数据漂亮。

而是 Hermes 正在回答一个更大的问题：AI Agent 到底怎样才算会成长。

一、Hermes 为什么突然"像样了"？因为它先把成长机制做成了系统能力

很多 Agent 项目也会接工具、接模型、接浏览器。

但 Hermes 真正拉开差距的，不是工具数量，而是它把"越用越强"拆成了几块可执行的工程结构。

1）它的记忆不是堆历史，而是主动管理

Hermes 的长期记忆不是无限追加。

它直接把内置记忆分成两份：MEMORY.md 和 USER.md，而且是有上限的。

官方配置里，前者大约 2200 字符 ，后者大约 1375 字符 。

这件事看上去像保守，实际上很聪明。

因为很多 Agent 的记忆系统，最后都死在一个问题上：越记越多，越记越乱，最后谁也不敢再往 prompt 里塞。

Hermes 的做法正好反过来。

它先承认上下文预算是稀缺资源，再倒逼自己做压缩、清理和取舍。

再配合 session_search 的 SQLite FTS5 全文检索，长期记忆和历史对话召回是分开的：

该常驻的，进 MEMORY / USER
该按需翻的，走 session_search

这不是"会记住"。

这是知道什么该常驻，什么该检索。

2）它把 Skill 做成了真正的程序性经验

Hermes 最有意思的一点，是它不把 Skill 当提示词收藏夹。

在它的官方文档和 README 里，Skill 的定位非常明确：
复杂任务跑通之后，要把条件、步骤、命令、坑点、验收标准沉成可复用方法。

而且这个技能不是一次写死，后续还能继续 patch、继续修。

这就把 Agent 的"经验"从聊天记录里拿出来，变成了独立资产。

很多系统也说自己能学习。

但大量所谓学习，最后只是"把历史再塞回来"。

Hermes 不一样。

它把学习拆成了两类：

偏好、约束、身份，进 memory
跑通过的方法，进 skill

前者回答"你是谁"。

后者回答"这事以后怎么做"。

这两件事一分开，系统就开始像人了。

3）它的多 Agent，不是热闹，而是隔离

Hermes 的 subagent 设计也值得高看一眼。

它不是把一堆 Agent 拉进群聊互相喊话，而是明确给子 Agent 独立上下文、独立终端、独立任务边界，甚至禁止递归委托、禁止直接写共享 memory。

这背后的判断很成熟：
协作的前提不是会分工，而是不会串味。

很多多 Agent 框架最容易翻车的地方，就是看起来很聪明，实际上权限、状态、上下文全混了。

Hermes 至少在架构上先把这个坑堵住了。

4）它已经给出了一套生产级 best practice

如果把 Hermes 近几版 release 和文档连起来看，你会发现它不只是"功能多"，而是在持续固化一套生产级方法：

长期记忆和历史搜索分离
skills 作为程序性记忆而不是提示词碎片
profile 隔离，避免多身份串配置
cron 定时任务原生内置
危险操作审批
多平台消息入口统一
本地、Docker、SSH、Daytona、Modal 等多后端运行

所以 Hermes 火，不只是因为会做事。

而是因为它开始像一套有方法论的 Agent 操作系统。

二、为什么 AMD、小米、阿里云会同时出现在 Hermes 语境里？

因为 Hermes 已经不是"只在一台开发机上玩玩"的项目了。

它的底层设计，本来就在往生态接入走。

先看小米：这是最明确的一次信号

在 4 月 8 日的 v0.8.0 release 里，官方直接写了：
Nous Portal 已支持 free-tier 的 Xiaomi MiMo v2 Pro，并且能用于压缩、视觉、总结等辅助任务。

这件事的价值，不只是"多了一个模型可用"。

而是 Hermes 对国产模型的接入，已经不是社区 Hack，而是正式能力面的一部分了。

再看阿里云：它已经是一等 provider 了

Hermes 官方 provider 文档里，Alibaba Cloud / DashScope 已经被列成一等接入项。

命令级示例都给到了：

bash 复制代码

hermes chat --provider alibaba --model qwen3.5-plus

这意味着什么？

意味着 Hermes 的生态边界已经不再是"欧美主流闭源模型"。

它在设计上已经把国内模型、国内 API 体系、国内团队的接入路径考虑进去了。

再看 AMD：重点不是一句背书，而是本地运行条件已经成熟

关于 AMD AI PC 场景，社区最近讨论很多。

我更关心的不是哪条新闻标题，而是 Hermes 为什么接得住本地端叙事。

答案其实在官方文档里：

Hermes 已经明确支持本地 / 自托管推理路径，比如 llama.cpp、Ollama、vLLM ，并且把本地模型的最低上下文要求直接卡在 64K。

这说明它从设计上就不是云端专属产品。

它天然适合被装进本地端、边缘端、AI PC、私有化环境。

换句话说，AMD、AI PC、国产模型这些关键词之所以会和 Hermes 连在一起，不是因为营销词碰巧撞上了，而是因为 Hermes 的架构本来就允许它进入这些场景。

它不是一个只能在 demo 环境里表演的 Agent。

它是真的在往可部署、可替换、可嫁接 走。

三、从一次 SMS RCE 修复，看清 Hermes 真正稀缺的地方

Hermes 在 4 月 13 日发布的 v0.9.0 里，release note 直接写得很重：
Twilio webhook signature validation（SMS RCE fix）。

官方还在短信接入文档里明确要求：

SMS_WEBHOOK_URL 必须配置
Hermes 会校验 X-Twilio-Signature
SMS_INSECURE_NO_SIGNATURE=true 只能用于本地开发，不能上生产

这说明问题已经非常明确：

这不是普通 bug 修补，而是一次真实的安全边界补齐。

技术上，它本质上是入站 webhook 来源校验缺失 。

如果服务端收到一个长得像 Twilio 的 POST 请求，就直接把其中的短信正文当成真实用户输入，那么攻击者就不需要真的发短信，只要伪造 webhook 请求，就能把恶意文本直接塞进 Agent。

一旦这个 SMS 通道后面还连着工具执行，问题就会从"伪造消息"继续滑向"远程指令执行"。

但这件事最值得行业看的，不只是"补了一个洞"。

而是 Hermes 这套架构，本来就有把一次事故转化为长期免疫资产的潜力。

为什么这么说？

因为它有三层天然适合安全沉淀的结构：

memory：可以记录攻击模式、风险偏好、禁区规则
skill：可以把一次修复流程沉成安全审查手册
prompt / context 扫描：对注入、越权、敏感指令有前置过滤意识

所以社区把这类故事讲成"自我免疫"，我觉得核心方向并没有讲错。

哪怕你把戏剧性细节先放一边，Hermes 的确比很多 Agent 更接近一种"可学习的防御体"：

它不是只靠开发者手工打补丁，还是在努力把每次踩坑变成系统的长期约束。

这在 Agent 时代非常关键。

因为传统软件修一个漏洞，通常意味着版本升级。

但 Agent 修一个漏洞，理想状态不只是代码变了，行为规则、审批边界、记忆口径、技能资产也应该一起变。

Hermes 至少已经把这条路铺出来了。

四、Hermes vs OpenClaw：不是谁替代谁，而是路线已经分岔

很多人喜欢把 Hermes 和 OpenClaw 直接放在一起 PK。

可以比。

但我更愿意说，它们越来越像两条不同路线。

从官方迁移文档和 Honcho 集成对比文档看，差异已经很明显了。

维度	Hermes	OpenClaw
记忆策略	有界记忆，主动压缩；长期记忆与 session_search 分开	更偏 workspace / 插件式长期协作
上下文注入	倾向一次注入、缓存命中、异步预取	插件钩子更强，但更容易每轮同步取上下文
Skill 角色	程序性经验资产，可生成、可 patch、可自修	更偏人为维护的工作区规则与配置
多 Agent 观	强隔离、强边界	更适合工作区/插件生态型协作

一句话总结：Hermes 在做"会成长的运行时"，OpenClaw 更像"可拼装的工作台"。

所以如果你问我怎么选：

偏 AI 编程、开发者效率、长期个人助手、可进化工作流：选 Hermes
偏已有工作区沉淀、强插件/强手工配置、桌面协作型场景：选 OpenClaw

真正的重点不是谁把谁打死。

而是 Hermes 已经很明确地走向了另一条路：
它要做的不是一个可配置的 Agent 壳，而是一个会沉淀、会复用、会收束风险的 Agent 运行时。

五、国内团队现在最该抄 Hermes 的，不是热度，是这 3 个动作

如果你是做 AI 产品、企业智能体、开发者工具链的，我觉得今天最值得抄的不是它的 UI，也不是它的模型名单。

而是下面这 3 件事：

今天就能做的 3 条

把"长期记忆"和"历史检索"拆开，别再把所有历史都硬塞 RAG
把一次成功任务沉成 Skill，别让经验永远停留在聊天记录里
把工具执行前的审批、签名校验、隔离边界补齐，别等上线后再补安全

本周该推进的 3 条

给 Agent 建一份有上限、可清理的长期记忆结构
给高频任务建一套可 patch 的技能库
给外部入口补签名校验、allowlist、审计日志和沙箱边界

这才是 Hermes 真正让行业兴奋的地方。

不是"它又会了一个新功能"。

而是它把 Agent 最难的三件事------成长、复用、止血------开始接成了一条线。

结语

Hermes 这波爆火，当然有流量因素。

但如果只把它理解成"一个很红的开源项目"，其实是低估了它。

它更重要的意义在于：
它正在把 AI Agent 从"会调用工具"推进到"会积累经验、会收束风险、会形成体系"。

11 万星不是终点。

一次 RCE 修复也不是重点。

真正值得行业盯住的是：它已经开始回答那个最难的问题------

AI 到底怎样才算真正成长。

如果这个问题被它持续答对，Hermes 接下来争的就不是下一个爆款项目的位置了。

它争的是 Agent 基础设施的入场券。

你更看好下一代 Agent 先跑成哪一种形态：
像 Hermes 这样先做"会成长的运行时"，还是像 OpenClaw 那样先做"可拼装的工作台"？或者从hermes的体系架构中，对你企业甚至个人搭建智能体有什么启发？