GitHub 85K Star 新王挑战 357K Star 霸主:Hermes 还是 OpenClaw?最强Agent框架怎么选

前言

2025年,大模型爱好者的烦恼,是AI Agent框架的"百花齐放,却难称心"------LangChain 略显笨重,AutoGen 过于复杂,LlamaIndex 又偏重检索......选型,成了一个令人纠结的难题。

到了2026年,局面变了。强大的AI Agent框架层出不穷,甜蜜的烦恼升级为:这么多强者,到底该选谁?

就在大家还在争论时,OpenClaw (那只"小龙虾")横空出世,凭借极简的操作和强大的执行力,掀起了一股"全民养虾"的热潮。可最近,另一个名字 Hermes Agent 被反复提及。截至4月15日,它在GitHub上已斩获 85k Star,大有新王登基之势,有的大模型爱好者甚至喊出口号:"爱马仕买不起,Hermes更懂你。"

两个框架,同样开源、同样支持自托管、同样能接入多平台消息......乍看之下,难分伯仲。但真正用过的人却会告诉你: "这俩根本不是一回事!" 那么,Hermes Agent 到底是什么?它和 OpenClaw 的本质差异在哪里?今天的文章笔者就和大家一起学习Hermes Agent的核心特性。

一、Hermes Agent是什么?

Hermes Agent 是由 Nous Research 于 2026 年 2 月开源的一款智能体框架。它的核心定位非常独特:不是传统的工具编排框架,而是一个"自我增强型 Agent 运行时"。

有人会问"现在已经有OpenClaw这个强大的Agent了,突然出来这么一个框架是干什么用的呢?",笔者通过如下例子帮你秒懂:

你是否有过这样的经历?好不容易让 Agent 完成了一个复杂任务,可一旦重启,它就像失忆了一样,下次遇到同样的问题依然不会。任务做完了就真的做完了,仿佛什么都没发生过。

大家是否有过这样的经历?好不容易让 Agent 完成了一个复杂任务,可一旦重启,它就像失忆了一样,下次遇到同样的问题依然不会。任务做完了就真的做完了,仿佛什么都没发生过。

Hermes 就是为了解决这个"记忆与成长"的痛点而生的。 它内置了一套闭环学习机制:

  • 执行(Execute) :利用 40+ 内置工具完成任务
  • 评估(Evaluate) :自动判断结果好坏
  • 抽象(Abstract) :将成功经验写成可复用的 Skill 文档,存入自己的 skills/ 目录
  • 精炼(Refine) :下次遇到同类任务时,直接调用已有 Skill,并持续优化

据官方文档和社区实测,经过 10--20 次同类任务的反复执行,Hermes 的速度能提升 2--3 倍 。这不是简单的缓存命中,而是真正的 经验积累

除了持久的经验记忆和自动创建 Skill 之外,Hermes 同样保留了与 OpenClaw 类似的能力:

  • 多平台消息网关:单一网关进程连接 Telegram、Discord、Slack 等,一次接入,处处可用
  • 定时自动化任务:内置 cron 调度器,可向任意平台主动推送消息或触发动作
  • 并行子智能体:为并行工作流生成隔离的子智能体,每个拥有独立的对话和终端;通过 RPC 将多步骤流水线压缩为零上下文消耗的操作
  • 完整浏览器与网页控制:网页搜索、页面提取、完整浏览器自动化(导航、点击、输入、截图),同时支持视觉分析、图像生成、文字转语音和多模型协作推理

除此之外更值得关注的是,Hermes 还能将用户使用工具的调用轨迹完整导出到数据集,并集成Atropos 框架,进行强化学习训练,从而持续提升大模型调用工具的准确性。(解决了工具调用数据集生产这一大难题呀!)

二、Hermes 核心架构剖析:"分层递进 + 模块化"的设计哲学

要想真正理解 Hermes,必须深入它的核心架构。笔者通过分析 Hermes 的技术文档和源码,将其设计哲学抽象为以下几个要点,分享给大家。

2.1 核心抽象:中央编排引擎

Hermes 通过一个同步循环的中央编排引擎 (代码位于 run_agent.py)统一调度四大模块:内存、记忆、工具、网关。所有消息------无论来自 CLI、Telegram 还是其他平台------都会进入这个引擎,流程如下:

复制代码
消息到达 → 生成任务 ID → 加载缓存的系统提示(或从内存、技能索引重建)
→ 压缩预检 → API 请求 → 工具调用(如果需要)→ 结果追加 → 循环直到完成
→ 会话存入 SQLite → 通过网关发送回复

2.2 从记住到进化:四层记忆系统

2.2.1 第一层:陈述性记忆(MEMORY.md/USER.md)

Hermes 将陈述性记忆拆分为两个文件,且刻意限制容量,迫使 Agent 只保留最有价值的信息:

文件 字符上限 内容 类比
MEMORY.md 2,200 环境事实、项目约定、学到的经验 Agent 的工作笔记
USER.md 1,375 用户偏好、沟通风格、期望、工作习惯 Agent 对用户的画像

两者合计约 3,600 字符 ------这个限制是故意的,强迫 Agent 只保留最有价值的信息。

2.2.2 第二层 情景记忆(SQLite+FTS5)

所有用户与 Hermes 的会话都会存入本地 SQLite 数据库,并使用 FTS5 (SQLite 自带的全文搜索引擎,效率远高于 LIKE 模糊查询)建立全文索引。

当需要检索历史时,Hermes 不会把整段对话塞进上下文,而是:

  1. 通过 session_search 检索相关片段
  2. 让大模型对检索结果做摘要
  3. 仅将摘要后的相关内容注入上下文

2.2.3 第三层:程序性记忆(Skills)

这就是 Hermes 最受好评的设计------Skills 。Agent 可以在与用户的对话中自动总结出可复用的操作指令集,存于 ~/.hermes/skills/ 目录下。

更妙的是:这些自动生成的 Skill 全部遵循 agentskills.io 规范,可以跨兼容的 Agent 迁移使用。

2.2.4 第四层:用户建模(Honcho)

前三层记忆都需要 Agent"主动写点什么"。第四层则完全不同:它不等待显式写入,而是在后台默默给你画像

这一层名为 Honcho,是一个可选的用户建模层,架在所有记忆之上。它采用辩证建模思路,在 12 个身份层中同时建模"你"与"智能体"的互动关系,跨会话悄悄记录你的偏好、说话风格、专业领域,并随时间不断更新。

大多数专用任务或自动化场景,前三层已经足够。但如果你把 Hermes 当作日常私人助理,希望回复风格高度贴合你的工作习惯,Honcho 会非常值得开启。

2.3 五步循环:自进化闭环

如前所述,Hermes 的核心机制是运行时的自进化闭环,能够在与用户的对话中自动沉淀可复用的 Skill。其基本流程如下:

步骤 动作 触发条件 输出
① 引导 SKILLS_GUIDANCE 注入 system prompt 代码硬编码 / 用户触发 Agent 的"保存意识"
② 创建 skill_manage(action='create') 5+ 工具调用 / 修复错误 / 走通新流程 SKILL.md 文件
③ 索引 prompt_builder 自动扫描技能目录 会话启动时 system prompt 中的技能索引
④ 执行 skill_view() 加载完整内容 Agent 根据用户任务匹配 按步骤执行任务
⑤ 修复 skill_manage(action='patch') 执行中发现问题 更新对应的 SKILL.md

值得一提的是,Hermes 更新已有 Skill 时优先使用 patch(只传递旧文本和替换内容),而非全量重写------既节省 Token,又降低"把好用的部分改崩"的风险。

2.4 保护进化链:上下文压缩

大模型的上下文窗口有限,长对话容易溢出。Hermes 的 ContextCompressor 采用分层压缩算法

  1. 剪枝:移除无用的工具调用结果
  2. 保护头部:保留 system prompt + 首轮对话
  3. 保护尾部:按 token 预算保留最近约 20K tokens
  4. 摘要中间轮次:用辅助 LLM 压缩中间内容,保留约 20% 信息
  5. 迭代更新:多次压缩时保留前次摘要,避免信息逐层丢失

2.5 默认零信任:安全机制

吸取了前期 OpenClaw 暴露的各种问题,Hermes 在设计上采用零信任默认策略

  • 每次写操作前扫描 12 种威胁模式(prompt_injection、role_hijack、exfil_curl 等)并需要用户确认
  • 并发对话时,使用排他文件锁防止并发会话覆盖彼此写入
  • 沙箱机制中,Docker 后端采用只读 rootfs,即使被攻破也无法持久化恶意代码

2.6 链接万物:网关机制

Hermes 的网关与 OpenClaw 有本质不同。在 OpenClaw 中,网关只管消息投递,与 Agent 是相互独立的两个个体;而在 Hermes 中,网关是中央编排循环的一部分

它不仅通过独立适配器对接 CLI、Telegram、Discord、Slack、WhatsApp、Signal、邮件等,还通过一个会话路由层 进行统一汇总。正因为网关与循环、会话路由是统一的,Hermes 能提供跨平台的无缝体验------你在 Telegram 上问的问题,最后甚至可以在终端中继续同一个话题。

2.7 真隔离:子智能体

Hermes 的子智能体机制设计得十分彻底。每个子智能体都拥有:

  • 全新的对话上下文
  • 独立的终端会话
  • 受限的工具集

子代理的上下文与父代理丝毫不冲突,父代理只需拿到执行结果即可。这种隔离比很多框架的"同上下文分支"要彻底得多,是真正的"真隔离"。

三、Hermes vs OpenClaw:最强 Agent 框架花落谁家?

Hermes Agent 问世后,网络上讨论最多的问题就是:它和 OpenClaw 到底哪个更强? 这节内容,笔者从六个维度进行硬核对比,帮大家理清思路。

3.1 架构风格:Agent-First vs Gateway-First

框架 架构风格 核心逻辑
Hermes Agent‑First Agent 本体是核心,消息网关只是"表面之一"。更像一个通用 Agent,顺便支持 Telegram、Discord 等渠道。
OpenClaw Gateway‑First 消息网关是单一真相源,所有消息从 50+ 渠道汇入网关,再路由到 Agent。更像智能助理的操作系统

3.2 设计哲学:成长 vs 治理

框架 设计哲学 核心目标
Hermes 成长(Growth) "Agent 应该越用越聪明"------自我学习、Skill 进化、深度个性化是系统设计的核心目标。
OpenClaw 治理(Governance) "平台边界必须清晰"------会话隔离、工具策略、权限治理、多用户支持是核心考量。

3.3 任务执行:单 Agent 深度 vs 多 Agent 协作

框架 执行模式 适用场景
Hermes 单 Agent 深度 + 子代理委派并行 强调"一个超级大脑"的连续性,适合个人深度助理或复杂任务链条。
OpenClaw Hub‑and‑Spoke 多 Agent 协作 多 Agent 通过网关协调,更适合团队协作、多角色分工场景。

3.4 生态集成

维度 Hermes OpenClaw
LLM 支持 200+(OpenRouter、Nous Portal、Ollama 等) 200+(OpenRouter、OpenAI、Anthropic 等)
消息渠道 7 个核心渠道(TG、Discord、Slack、WhatsApp、Signal、Email、CLI) 50+ 渠道(含 QQ、LINE、飞书、Teams 等)
Skill 生态 自生成 + 公共目录 5,700+ ClawHub 社区 Skill
MCP 支持 ✅ 原生 + Server 模式 ✅ 原生

3.5 记忆系统

框架 记忆架构 特点
Hermes 4 层架构(会话历史 + 用户画像 + FTS5 全文搜索 + 程序性 Skill) 语义密度高,支持自动学习与跨会话画像
OpenClaw Markdown 文件 + SQLite 人类可读、易调试,但语义检索能力相对基础

3.6 部署与安全性

框架 部署难度 安全记录与设计
Hermes 一行命令搞定,部署成本接近零 Docker 后端采用只读根文件系统,默认零信任检查,安全加固较完善
OpenClaw 本地 / Docker 为主,部署简单 2026 年已曝出多个 CVE(令牌泄露、提示注入、RCE),安全事件相对较多

四、Hermes 和 OpenClaw,我要 Pick 谁?

通过前面的学习,大家应该已经掌握了 Hermes 的核心特性。这一节,笔者直接给出明确的适用场景和建议。

4.1 选 Hermes,如果你......

  • 想要一个 "越用越懂你"的个人超级助理
  • 重视安全默认值,不愿为漏洞操心
  • 使用 Python 技术栈,想深入研究 Agent 的自我进化路径
  • 任务类型偏向研究、分析、单 Agent 深度工作

4.2 选 OpenClaw,如果你......

  • 需要多渠道统一接入(企业微信、飞书、Teams 等)
  • 运行多 Agent 协作或团队工作流
  • 重视平台治理、会话隔离、权限边界
  • 想快速接入丰富的社区 Skill 生态(5,700+ 直接可用)

4.3 选型建议:两者可以兼得吗?

答案是:可以,而且聪明人已经在这么做了。

Hermes 官方提供了 hermes claw migrate 命令,可以直接导入 OpenClaw 的配置(人格文件、记忆、Skill、消息配置),迁移成本极低。

推荐的混合架构思路

  • OpenClaw 作为运营网关:负责渠道接入、团队路由、权限治理
  • Hermes 作为学习层:负责深度个性化、Skill 自生成、复杂任务执行

两者互补,而不是非此即彼。如果你已经在一个框架上投入了精力,不妨用另一个作为增强层------这可能才是 2026 年最强 Agent 架构的"隐藏答案"。

五、总结

从 2025 年的"选型困难",到 2026 年的"强者对决",AI Agent 框架的进化速度远超想象。Hermes Agent 的出现,不是要简单地"取代"OpenClaw,而是为开发者提供了一条全新的路径:让 Agent 拥有真正的长期记忆与自我进化能力

人工智能时代,对于我们程序员来说,也是一个难得的机会窗口。我们不仅是 Agent 的使用者,更可以发挥技术所长,成为 Agent 的创造者。

笔者的大模型 Agent 开发专栏------《深入浅出 LangChain & LangGraph AI Agent 智能体开发》 ------一直在持续更新。该专栏基于笔者在实际项目中的深度使用经验,系统讲解如何使用 LangChain / LangGraph 开发智能体,目前已更新 43 讲,并会持续补充实战与拓展内容。无论你是否接触过 LangChain,只要对 AI Agent 开发感兴趣,都欢迎关注我的掘金账号,或关注我的同名微信公众号 「大模型真好玩」 。 每期分享涉及的代码,可在公众号私信回复 「LangChain智能体开发」 免费获取。

框架会迭代,Star 数会变化,但"让 Agent 持续成长"这个理念,才刚刚开始。

相关推荐
KD871490014 小时前
宁波ISO9001认证:立足宁波制造,对标世界标准
大数据·人工智能·制造
卷卷说风控5 小时前
重新认知AI Agent
人工智能
生命是有光的5 小时前
【深度学习】卷积神经网络CNN
人工智能·深度学习·cnn
后端小肥肠5 小时前
Hermes Agent喂饭级教程:安装、迁移 OpenClaw、接入飞书全流程
人工智能·agent
拥抱AI的猿5 小时前
AI提示词
人工智能
henrylin99996 小时前
Hermes Agent 核心运行系统调用流程--源码分析
开发语言·人工智能·python·机器学习·hermesagent
IT_陈寒6 小时前
Python多进程共享变量那个坑,我差点没爬出来
前端·人工智能·后端
泰恒6 小时前
国内外大模型的区别与差距
人工智能·深度学习·yolo·机器学习·计算机视觉
javaDocker6 小时前
基于Hermes Agent 的 AI 可视化协同研发流水线—实现机制与实现逻辑
人工智能