Hermes为什么开始像基础设施:11万星、RCE修复与生态接入

Hermes 的"成人礼":11 万星、RCE 修复与生态接入,下一代 Agent 为什么开始像基础设施

一个开源 Agent 项目,凭什么能在同一段时间里,让小米、阿里云、AMD 这些名字同时出现在它的讨论链里?

只靠热度不够。

只靠会调工具也不够。

真正让 Hermes 值得重估的,是它开始同时通过三种完全不同的考试:开源社区的增长考试、工程体系的落地考试、安全事件的压力考试。

截至 4 月 23 日,Hermes Agent 的 GitHub 星标已经来到 11.1 万 。从 3 月 12 日的 v0.2.0 到 4 月 16 日的 v0.10.0 ,官方在 35 天里连续发了 9 个版本 。GitHub contributors 列表也已经超过 500 位

这不是一个"做着玩"的节奏。

这更像一个项目从明星 demo,开始往基础设施位置拱。

真正值得去看的点,也不只是数据漂亮。

而是 Hermes 正在回答一个更大的问题:AI Agent 到底怎样才算会成长。

一、Hermes 为什么突然"像样了"?因为它先把成长机制做成了系统能力

很多 Agent 项目也会接工具、接模型、接浏览器。

但 Hermes 真正拉开差距的,不是工具数量,而是它把"越用越强"拆成了几块可执行的工程结构。

1)它的记忆不是堆历史,而是主动管理

Hermes 的长期记忆不是无限追加。

它直接把内置记忆分成两份:MEMORY.mdUSER.md,而且是有上限的

官方配置里,前者大约 2200 字符 ,后者大约 1375 字符

这件事看上去像保守,实际上很聪明。

因为很多 Agent 的记忆系统,最后都死在一个问题上:越记越多,越记越乱,最后谁也不敢再往 prompt 里塞。

Hermes 的做法正好反过来。

它先承认上下文预算是稀缺资源,再倒逼自己做压缩、清理和取舍。

再配合 session_searchSQLite FTS5 全文检索,长期记忆和历史对话召回是分开的:

  • 该常驻的,进 MEMORY / USER
  • 该按需翻的,走 session_search

这不是"会记住"。

这是知道什么该常驻,什么该检索

2)它把 Skill 做成了真正的程序性经验

Hermes 最有意思的一点,是它不把 Skill 当提示词收藏夹。

在它的官方文档和 README 里,Skill 的定位非常明确:
复杂任务跑通之后,要把条件、步骤、命令、坑点、验收标准沉成可复用方法。

而且这个技能不是一次写死,后续还能继续 patch、继续修。

这就把 Agent 的"经验"从聊天记录里拿出来,变成了独立资产。

很多系统也说自己能学习。

但大量所谓学习,最后只是"把历史再塞回来"。

Hermes 不一样。

它把学习拆成了两类:

  • 偏好、约束、身份,进 memory
  • 跑通过的方法,进 skill

前者回答"你是谁"。

后者回答"这事以后怎么做"。

这两件事一分开,系统就开始像人了。

3)它的多 Agent,不是热闹,而是隔离

Hermes 的 subagent 设计也值得高看一眼。

它不是把一堆 Agent 拉进群聊互相喊话,而是明确给子 Agent 独立上下文、独立终端、独立任务边界,甚至禁止递归委托、禁止直接写共享 memory。

这背后的判断很成熟:
协作的前提不是会分工,而是不会串味。

很多多 Agent 框架最容易翻车的地方,就是看起来很聪明,实际上权限、状态、上下文全混了。

Hermes 至少在架构上先把这个坑堵住了。

4)它已经给出了一套生产级 best practice

如果把 Hermes 近几版 release 和文档连起来看,你会发现它不只是"功能多",而是在持续固化一套生产级方法:

  • 长期记忆和历史搜索分离
  • skills 作为程序性记忆而不是提示词碎片
  • profile 隔离,避免多身份串配置
  • cron 定时任务原生内置
  • 危险操作审批
  • 多平台消息入口统一
  • 本地、Docker、SSH、Daytona、Modal 等多后端运行

所以 Hermes 火,不只是因为会做事。

而是因为它开始像一套有方法论的 Agent 操作系统

二、为什么 AMD、小米、阿里云会同时出现在 Hermes 语境里?

因为 Hermes 已经不是"只在一台开发机上玩玩"的项目了。

它的底层设计,本来就在往生态接入走。

先看小米:这是最明确的一次信号

在 4 月 8 日的 v0.8.0 release 里,官方直接写了:
Nous Portal 已支持 free-tier 的 Xiaomi MiMo v2 Pro,并且能用于压缩、视觉、总结等辅助任务。

这件事的价值,不只是"多了一个模型可用"。

而是 Hermes 对国产模型的接入,已经不是社区 Hack,而是正式能力面的一部分了。

再看阿里云:它已经是一等 provider 了

Hermes 官方 provider 文档里,Alibaba Cloud / DashScope 已经被列成一等接入项。

命令级示例都给到了:

bash 复制代码
hermes chat --provider alibaba --model qwen3.5-plus

这意味着什么?

意味着 Hermes 的生态边界已经不再是"欧美主流闭源模型"。

它在设计上已经把国内模型、国内 API 体系、国内团队的接入路径考虑进去了。

再看 AMD:重点不是一句背书,而是本地运行条件已经成熟

关于 AMD AI PC 场景,社区最近讨论很多。

我更关心的不是哪条新闻标题,而是 Hermes 为什么接得住本地端叙事

答案其实在官方文档里:

Hermes 已经明确支持本地 / 自托管推理路径,比如 llama.cpp、Ollama、vLLM ,并且把本地模型的最低上下文要求直接卡在 64K

这说明它从设计上就不是云端专属产品。

它天然适合被装进本地端、边缘端、AI PC、私有化环境。

换句话说,AMD、AI PC、国产模型这些关键词之所以会和 Hermes 连在一起,不是因为营销词碰巧撞上了,而是因为 Hermes 的架构本来就允许它进入这些场景。

它不是一个只能在 demo 环境里表演的 Agent。

它是真的在往可部署、可替换、可嫁接 走。


三、从一次 SMS RCE 修复,看清 Hermes 真正稀缺的地方

Hermes 在 4 月 13 日发布的 v0.9.0 里,release note 直接写得很重:
Twilio webhook signature validation(SMS RCE fix)

官方还在短信接入文档里明确要求:

  • SMS_WEBHOOK_URL 必须配置
  • Hermes 会校验 X-Twilio-Signature
  • SMS_INSECURE_NO_SIGNATURE=true 只能用于本地开发,不能上生产

这说明问题已经非常明确:

这不是普通 bug 修补,而是一次真实的安全边界补齐。

技术上,它本质上是入站 webhook 来源校验缺失

如果服务端收到一个长得像 Twilio 的 POST 请求,就直接把其中的短信正文当成真实用户输入,那么攻击者就不需要真的发短信,只要伪造 webhook 请求,就能把恶意文本直接塞进 Agent。

一旦这个 SMS 通道后面还连着工具执行,问题就会从"伪造消息"继续滑向"远程指令执行"。

但这件事最值得行业看的,不只是"补了一个洞"。

而是 Hermes 这套架构,本来就有把一次事故转化为长期免疫资产的潜力。

为什么这么说?

因为它有三层天然适合安全沉淀的结构:

  • memory:可以记录攻击模式、风险偏好、禁区规则
  • skill:可以把一次修复流程沉成安全审查手册
  • prompt / context 扫描:对注入、越权、敏感指令有前置过滤意识

所以社区把这类故事讲成"自我免疫",我觉得核心方向并没有讲错。

哪怕你把戏剧性细节先放一边,Hermes 的确比很多 Agent 更接近一种"可学习的防御体":

它不是只靠开发者手工打补丁,还是在努力把每次踩坑变成系统的长期约束。

这在 Agent 时代非常关键。

因为传统软件修一个漏洞,通常意味着版本升级。

但 Agent 修一个漏洞,理想状态不只是代码变了,行为规则、审批边界、记忆口径、技能资产也应该一起变。

Hermes 至少已经把这条路铺出来了。


四、Hermes vs OpenClaw:不是谁替代谁,而是路线已经分岔

很多人喜欢把 Hermes 和 OpenClaw 直接放在一起 PK。

可以比。

但我更愿意说,它们越来越像两条不同路线。

从官方迁移文档和 Honcho 集成对比文档看,差异已经很明显了。

维度 Hermes OpenClaw
记忆策略 有界记忆,主动压缩;长期记忆与 session_search 分开 更偏 workspace / 插件式长期协作
上下文注入 倾向一次注入、缓存命中、异步预取 插件钩子更强,但更容易每轮同步取上下文
Skill 角色 程序性经验资产,可生成、可 patch、可自修 更偏人为维护的工作区规则与配置
多 Agent 观 强隔离、强边界 更适合工作区/插件生态型协作

一句话总结:Hermes 在做"会成长的运行时",OpenClaw 更像"可拼装的工作台"。

所以如果你问我怎么选:

  • 偏 AI 编程、开发者效率、长期个人助手、可进化工作流:选 Hermes
  • 偏已有工作区沉淀、强插件/强手工配置、桌面协作型场景:选 OpenClaw

真正的重点不是谁把谁打死。

而是 Hermes 已经很明确地走向了另一条路:
它要做的不是一个可配置的 Agent 壳,而是一个会沉淀、会复用、会收束风险的 Agent 运行时。

五、国内团队现在最该抄 Hermes 的,不是热度,是这 3 个动作

如果你是做 AI 产品、企业智能体、开发者工具链的,我觉得今天最值得抄的不是它的 UI,也不是它的模型名单。

而是下面这 3 件事:

今天就能做的 3 条

  • 把"长期记忆"和"历史检索"拆开,别再把所有历史都硬塞 RAG
  • 把一次成功任务沉成 Skill,别让经验永远停留在聊天记录里
  • 把工具执行前的审批、签名校验、隔离边界补齐,别等上线后再补安全

本周该推进的 3 条

  • 给 Agent 建一份有上限、可清理的长期记忆结构
  • 给高频任务建一套可 patch 的技能库
  • 给外部入口补签名校验、allowlist、审计日志和沙箱边界

这才是 Hermes 真正让行业兴奋的地方。

不是"它又会了一个新功能"。

而是它把 Agent 最难的三件事------成长、复用、止血------开始接成了一条线。


结语

Hermes 这波爆火,当然有流量因素。

但如果只把它理解成"一个很红的开源项目",其实是低估了它。

它更重要的意义在于:
它正在把 AI Agent 从"会调用工具"推进到"会积累经验、会收束风险、会形成体系"。

11 万星不是终点。

一次 RCE 修复也不是重点。

真正值得行业盯住的是:它已经开始回答那个最难的问题------

AI 到底怎样才算真正成长。

如果这个问题被它持续答对,Hermes 接下来争的就不是下一个爆款项目的位置了。

它争的是 Agent 基础设施的入场券。

你更看好下一代 Agent 先跑成哪一种形态:
像 Hermes 这样先做"会成长的运行时",还是像 OpenClaw 那样先做"可拼装的工作台"?或者从hermes的体系架构中,对你企业甚至个人搭建智能体有什么启发?


相关推荐
QuestLab2 小时前
【第22期】2026年4月25日 AI日报
人工智能
aq55356002 小时前
AI训练GPU算力指南:从入门到超算的精准匹配
人工智能·gpu算力
隔窗听雨眠2 小时前
GPU算力梯队与任务匹配指南
人工智能·gpu算力
执于代码2 小时前
智能客服的agent 的架构和作用以及源码分析
架构
AI木马人2 小时前
6.深度学习入门:神经网络是如何“思考”的?
人工智能·深度学习·神经网络
AC赳赳老秦2 小时前
OpenClaw进阶技巧:批量修改文件内容、替换关键词,解放双手
java·linux·人工智能·python·算法·测试用例·openclaw
鹓于2 小时前
备忘录:RAG(检索增强生成框架)
人工智能
Java小白笔记2 小时前
OpenClaw 实战方法论
java·开发语言·人工智能·ai·全文检索·ai编程·ai写作
Tigerbot2 小时前
虎博科技CEO卢鑫:GEO方法论提出者,AI Marketing 与 AI GEO专家
大数据·人工智能·科技