Hermes Agent 深度调研:开源社区中自学习闭环最系统化的 AI Agent

文章目录
- [Hermes Agent 深度调研:开源社区中自学习闭环最系统化的 AI Agent](#Hermes Agent 深度调研:开源社区中自学习闭环最系统化的 AI Agent)
-
- [1. 基本画像:一个增长极快的开源项目](#1. 基本画像:一个增长极快的开源项目)
- [2. 核心架构:自学习闭环是最大差异点](#2. 核心架构:自学习闭环是最大差异点)
-
- [2.1 三层持久记忆系统](#2.1 三层持久记忆系统)
- [2.2 Skill 系统:程序性记忆](#2.2 Skill 系统:程序性记忆)
- [2.3 辩证式用户建模(Honcho)](#2.3 辩证式用户建模(Honcho))
- [2.4 定期自省(Nudge 机制)](#2.4 定期自省(Nudge 机制))
- [2.5 RL 训练闭环(研究级特性)](#2.5 RL 训练闭环(研究级特性))
- [3. 模型无关与多平台能力](#3. 模型无关与多平台能力)
-
- [3.1 模型无关设计](#3.1 模型无关设计)
- [3.2 全平台消息网关](#3.2 全平台消息网关)
- [3.3 六种终端后端](#3.3 六种终端后端)
- [4. 生态爆发:社区的真实投票](#4. 生态爆发:社区的真实投票)
-
- [agentskills.io 标准的扩散](#agentskills.io 标准的扩散)
- 社区活跃度速览
- [5. 竞品对比:定位差异大于技术差异](#5. 竞品对比:定位差异大于技术差异)
-
- [关于 OpenClaw 的演化](#关于 OpenClaw 的演化)
- [6. 客观评价:优势与局限](#6. 客观评价:优势与局限)
- [7. 总结:Hermes Agent 在 Agent 格局中的位置](#7. 总结:Hermes Agent 在 Agent 格局中的位置)
- 参考资料
2026 年 5 月,AI Agent 赛道已经拥挤到让人审美疲劳。Claude Code、Cursor、Copilot、Devin、OpenAI Codex CLI......每隔几周就有新工具宣布自己是"下一代开发助手"。这些工具大多具备一定的记忆能力------Claude Code 有 CLAUDE.md 和 auto memory,Cursor 有项目级记忆------但它们的记忆本质上是被动的配置文件 ,需要用户手动维护或按预设规则写入。真正的差距不在于"有没有记忆",而在于"能不能从经验中自动学习新技能并持续改进"。
Hermes Agent 是 Nous Research 对这个问题的回答。它不是又一个 IDE 插件或 API 包装器,而是一个可以自部署的、具备持久记忆和自动化学习闭环的自主智能体。本文从架构设计、生态现状、竞品对比和局限性四个维度,对 Hermes Agent 进行一次尽可能全面的调研。
声明:本文为架构级调研,不含实操体验。文中架构细节来源于官方 README、飞书调研文档及 GitHub 仓库公开代码/文档,精确数字(如 token 容量、百分比阈值)均标注于数据来源表中。
调研时间 :2026 年 5 月 3 日
数据来源:GitHub 官方仓库 README、NousResearch 组织仓库、GitHub 生态搜索(68+ 相关仓库)、agentskills.io 标准生态(31+ 仓库)、内部飞书调研文档
1. 基本画像:一个增长极快的开源项目
| 属性 | 数据 |
|---|---|
| 项目名 | Hermes Agent ☤ |
| 开发者 | Nous Research |
| 许可证 | MIT(完全开源) |
| 当前版本 | v0.12.0(2026.5.6) |
| GitHub | NousResearch/hermes-agent |
| Stars | ~135k |
| Commits | 7000+ |
| 创建时间 | 2025 年 7 月 22 日 |
| 最近推送 | 2026 年 5 月 3 日(调研当天仍有活跃提交) |
| 主要语言 | Python(93%) |
| Release | 8 个正式版本 |
从 2025 年 7 月创建到近 13 万 Stars,增速显著。需要指出的是,Stars 数量反映的是社区关注度,而非项目成熟度 ------Hermes 仍处于 v0.x 阶段,距离 1.0 稳定版还有距离。这种关注度背后,一方面是 Nous Research 在开源 LLM 社区的长期积累(该团队此前以 Hermes 系列微调模型闻名于 Hugging Face 社区,在开源 LLM 排行榜上长期占据前列),另一方面是 Hermes Agent 确实击中了一个市场空白------一个不绑定特定模型、不绑定特定 IDE、可自部署的全能 Agent。
关于 Nous Research 的可持续性:该团队运营 Nous Portal 商业模型平台,提供付费 API 服务,具备一定的商业化基础。但与 Anthropic、OpenAI 等获得大规模融资的公司相比,其维护一个 13 万 Stars 项目的长期能力仍需观察。
2. 核心架构:自学习闭环是最大差异点
Hermes Agent 的技术架构可以用一句话概括:围绕"Learning Loop"构建一切。这是它与所有竞品最根本的区别。

这个闭环由 5 个子系统协同运作:
2.1 三层持久记忆系统
| 层级 | 存储介质 | 容量 | 加载方式 | 用途 |
|---|---|---|---|---|
| MEMORY.md | Agent 个人笔记 | ~800 tokens | 会话启动注入 system prompt | 环境事实、项目约定、工具技巧 |
| USER.md | 用户画像 | ~500 tokens | 会话启动注入 system prompt | 姓名、角色、偏好、沟通风格 |
| Session Search | SQLite FTS5 全文索引 | 无限制 | 按需搜索 + LLM 摘要 | 跨会话回忆 |
一个精妙的设计决策是冻结快照模式 :Memory 在会话启动时一次性注入 system prompt,整个会话期间不再改变。这不是缺陷,而是为了保护 LLM 的 prefix cache------被打断的 cache 意味着推理性能下降。Agent 在会话中对 Memory 的修改立即写入磁盘,但在下一次会话才生效。
容量管理也值得注意:超过 80% 容量时,Agent 会自动合并相关条目。写入前有安全扫描,拦截 prompt injection 和凭证泄露。
2.2 Skill 系统:程序性记忆
Skill 是 Agent 的"会做什么",而不是"知道什么"。触发创建的条件包括:
- 成功完成复杂任务(5+ 工具调用)
- 遇到错误后找到正确路径
- 用户纠正了 Agent 的方法
- 发现非平凡的工作流
Skill 遵循 agentskills.io 开放标准,文件格式为 YAML frontmatter + Markdown:
yaml
---
name: deploy-k8s
description: Kubernetes 部署流程
version: 1.0.0
platforms: [linux, macos]
metadata:
hermes:
tags: [kubernetes, devops]
category: devops
requires_toolsets: [terminal]
---
# Kubernetes 部署
## When to Use
当需要部署服务到 K8s 集群时
## Procedure
1. 检查 kubectl 上下文
2. 验证 YAML 配置
3. 执行 apply
4. 等待 rollout 完成
加载采用三级渐进式策略来最小化 token 消耗:
Level 0: skills_list() → 仅名称+描述(~3K tokens)
Level 1: skill_view(name) → 完整内容+元数据
Level 2: skill_view(name, path) → 特定参考文件
Skill 不仅能创建,还能自我改进------通过 patch(定向修补)、edit(结构性重写)、delete(清理无用 skill)等操作。
Skill Hub 生态 支持从 6 个来源安装共享 Skill:官方内置、Vercel 的 skills.sh、网站 .well-known/skills/ 自动发现、GitHub 仓库、clawhub.ai 第三方市场、LobeHub agent 转换。所有外部 Skill 安装前都经过安全扫描。
2.3 辩证式用户建模(Honcho)
通过集成 Honcho(Plastic Labs 开源项目),Hermes 构建了辩证式用户模型------用"正题/反题/合题"的方法,从可能矛盾的观察中逐步细化对用户的理解。这个模型跨会话持续演进,影响 Agent 的回复风格和决策判断。
此外还支持 8 个外部 Memory Provider 插件:Honcho、OpenViking、Mem0、Hindsight、Holographic、RetainDB、ByteRover、Supermemory,提供知识图谱、语义搜索、自动事实提取等额外能力。从社区生态来看,还有新兴的第三方记忆方案,如:
- YantrikDB:自维护记忆,支持矛盾追踪和可解释召回
- Supabase pgvector:基于 PostgreSQL 向量搜索的记忆插件
- Memory-wiki-plugin:Karpathy 风格的 wiki 记忆
- Mnemosyne:零依赖、亚毫秒级 AI 记忆系统
2.4 定期自省(Nudge 机制)
Agent 会周期性地自我提醒:回顾近期交互中有价值的信息,将短期观察整合为长期记忆,更新用户模型,判断是否需要创建或优化 Skill。这是一个内部自触发机制,不需要用户干预。
2.5 RL 训练闭环(研究级特性)
Hermes 内置了强化学习训练管线,可以将交互轨迹导出为 ShareGPT 格式用于微调 tool-calling 模型:
| 组件 | 文件 | 用途 |
|---|---|---|
| Trajectory 保存 | agent/trajectory.py |
导出交互轨迹 |
| Batch Runner | batch_runner.py |
批量生成轨迹 |
| Trajectory Compressor | trajectory_compressor.py |
压缩轨迹数据 |
| Tinker-Atropos | tinker-atropos/(子模块) |
RL 训练环境 |
| RL CLI | rl_cli.py |
强化学习命令行 |
NousResearch 还专门维护了 hermes-agent-self-evolution 仓库,使用 DSPy + GEPA(遗传演化提示算法)实现进化式自我改进。这意味着 Hermes 不仅在使用层面自学习,还在模型训练层面形成了数据飞轮。
三层递进的学习能力:
- 声明式记忆:知道什么(MEMORY.md + USER.md + Session Search)
- 程序式记忆:会做什么(Skills 自动创建 + 自我改进)
- 模型级进化:RL 轨迹导出 → 微调下一代模型
这类似于人类学习的"记住 → 会做 → 形成直觉"的递进过程。
3. 模型无关与多平台能力
3.1 模型无关设计
Hermes Agent 通过接入 10+ 模型提供商(其中 OpenRouter 单个平台即提供 200+ 模型),实现了广泛的模型覆盖。切换只需 hermes model:
| 提供商 | 说明 |
|---|---|
| Nous Portal | Nous 自有模型平台 |
| OpenRouter | 200+ 模型可选 |
| NVIDIA NIM | Nemotron 系列 |
| OpenAI | GPT 系列 |
| Xiaomi MiMo | 小米 MiMo 平台 |
| Kimi/Moonshot | 月之暗面 |
| MiniMax | MiniMax |
| Hugging Face | HF 模型 |
| z.ai/GLM | 智谱 GLM |
| 自定义端点 | 任何 OpenAI 兼容 API |
值得注意的是,Xiaomi MiMo 被列为官方支持的模型提供商之一,说明国产模型平台已被主流开源 Agent 框架纳入生态。
3.2 全平台消息网关
通过统一的 Gateway 进程,一个 Agent 实例可同时接入 15+ 通讯平台:
Telegram / Discord / Slack / WhatsApp / Signal / Matrix / Mattermost / Email / SMS / DingTalk / 飞书(Feishu) / WeCom / BlueBubbles / Home Assistant / CLI
支持跨平台对话连续性------在一个平台开始对话,另一个平台继续。
3.3 六种终端后端
| 后端 | 特点 |
|---|---|
| Local | 直接本地执行 |
| Docker | 容器化隔离 |
| SSH | 远程服务器执行 |
| Daytona | Serverless,空闲时休眠 |
| Singularity | HPC 容器运行时 |
| Modal | Serverless,空闲时休眠 |
Daytona 和 Modal 的按需唤醒模式让 Hermes 可以跑在 $5/月的 VPS 上,空闲成本几乎为零。
4. 生态爆发:社区的真实投票
截至调研时间(2026 年 5 月 3 日),以 "hermes-agent NousResearch" 为关键词在 GitHub 搜索,返回 68 个结果(含独立项目和 fork,排除纯镜像后仍有大量功能性仓库)。这些项目不是简单的 fork,而是功能性的扩展和适配:
| 类型 | 代表项目 | 说明 |
|---|---|---|
| 安全加固 | hermesclaw | NVIDIA OpenShell 硬件级沙箱隔离 |
| 轻量化 | hermes-agent-lite | 86% 体积瘦身(190M→27M) |
| 部署方案 | HermesFace | HuggingFace Spaces 免费部署(2 vCPU, 16GB RAM) |
| 部署方案 | hermes-agent-railway | Railway + SearXNG 一键部署 |
| 部署方案 | hermes-agent-arm64 | ARM64 构建,支持 Coolify |
| 记忆插件 | mnemosyne | 零依赖亚毫秒级记忆系统 |
| 记忆插件 | hermes-supabase-memory | Supabase pgvector 记忆 |
| 记忆插件 | yantrikdb-hermes-plugin | 矛盾追踪 + 可解释召回 |
| 记忆插件 | memory-wiki-plugin | Karpathy 风格 wiki 记忆 |
| 本地化 | u-hermes(虾米) | 中文便携版(Linux Live + Windows 商业版) |
| 文档工具 | hermes-docs-mcp | 离线文档搜索 MCP 服务器 |
| 应用扩展 | autonovel-skill | 自主小说写作管线 |
| 模型路由 | crazyrouter-hermes | 600+ 模型,比 OpenRouter 便宜 30-50% |
| 架构教学 | hermes-agent-curriculum | 完整的架构课程 |
此外,NousResearch 官方还维护了:
- hermes-paperclip-adapter:让 Hermes 作为 Paperclip 公司的托管员工运行
- hermes-agent-self-evolution:DSPy + GEPA 进化式自改进
- autonovel:自主小说写作管线
- Hermes-Function-Calling:函数调用训练数据(据仓库信息,创建较早,2025 年底仍有推送)
agentskills.io 标准的扩散
Hermes Agent 推动的 agentskills.io 开放标准已经获得了独立于 Hermes 本身的生命力。GitHub 上有 31+ 个仓库采用该标准,覆盖:
- 网络安全(754 个结构化安全 Skill,映射到 MITRE ATT&CK 等 5 个框架)
- 应用安全扫描(SAST、DAST、依赖审计)
- .NET / Flutter / Drupal 等开发框架
- DevOps 运维(Kubernetes、DDEV、Planton)
- 业务运营(19 个商业 Skill:策略、销售、财务、HR)
- 小说写作、视频制作、技术面试幻灯片等跨领域应用
该标准兼容 Claude Code、GitHub Copilot、Codex CLI、Cursor、Gemini CLI 等 20+ 平台,已经从 Hermes 专属标准演变为跨平台 Agent Skill 交换协议。
社区活跃度速览
截至 2026 年 5 月 3 日,GitHub Issues/PR 编号已达到 #19136,说明社区提交了大量的 bug 报告、功能请求和代码贡献。从最新 PR 来看(如 #19136 修复子 Agent fallback chain 继承问题),社区贡献者已经深入到框架核心逻辑层面,而非仅停留在外围集成。项目在调研当天仍有活跃的 commit 和 PR 合并,开发节奏处于高速迭代期。
5. 竞品对比:定位差异大于技术差异
| 维度 | Hermes Agent | Claude Code | Cursor | GitHub Copilot |
|---|---|---|---|---|
| 开源 | MIT 完全开源 | 部分开源(SDK) | 闭源 | 闭源 |
| 定位 | 全能自主 Agent | 编程 Agent(CLI/IDE) | AI 代码编辑器 | 代码补全/Chat |
| 模型绑定 | 模型无关,200+ 可选 | Claude 系列 | 多模型 | GPT 系列为主 |
| 自学习 | 内置 Learning Loop | 文件级 memory | 项目级记忆 | 无 |
| Skill 系统 | 自动创建 + 自我改进 | 用户手动配置 | 无 | 无 |
| 持久记忆 | FTS5 + LLM 跨会话 | CLAUDE.md/memory | 项目级 | 无 |
| 多平台通讯 | 15+ 平台统一网关 | CLI/IDE 插件 | IDE 内 | IDE 内 |
| 沙箱 | 6 种后端 | 本地/Docker | 本地 | 本地 |
| 定时任务 | 内置 Cron | 需外部配置 | 无 | 无 |
| 子 Agent | 隔离并行子 Agent | 有(Agent tool) | 无 | 无 |
| RL 训练 | 内置 Atropos | 无 | 无 | 无 |
| 部署位置 | 自有服务器/VPS | 本地/云 | 本地 | 云 |
上表聚焦主流编码 Agent。但 Hermes 的真正对标其实是通用 Agent 赛道------这个赛道还包括 AutoGPT、CrewAI、LangGraph Agent、OpenAI Agents SDK 等方案:
| 维度 | Hermes Agent | AutoGPT | CrewAI | OpenAI Agents SDK |
|---|---|---|---|---|
| 自学习闭环 | 内置(Memory + Skill + RL) | 有限(记忆但无 Skill 自创建) | 无 | 无 |
| Skill 自动创建 | 有(agentskills.io 标准) | 无 | 无 | 无 |
| 模型绑定 | 无(200+ 模型) | 无 | 无 | OpenAI 系列 |
| 多平台通讯 | 15+ 平台 | 无 | 无 | 无 |
| 部署便捷性 | 中(需 VPS) | 低 | 中 | 高(云端) |
| 社区规模 | ~80K Stars | ~170K Stars | ~30K Stars | 较新 |
这两张表格揭示的核心洞察是:Hermes Agent 和 Claude Code/Cursor 不是同一品类的产品 。后者是编程辅助工具,Hermes 是通用自主 Agent。它更接近一个"可编程的数字员工",而不是"更智能的代码编辑器"。而与 AutoGPT 等通用 Agent 相比,Hermes 的差异点在于系统化的自学习闭环 和开放的 Skill 标准。
这意味着在纯编程任务上,Hermes 可能不如 Claude Code 等专业工具深度好。但在"帮我每天早上 8 点从 Telegram 总结昨天的 GitHub 通知,然后发到 Slack 频道"这类场景里,Hermes 是目前开源方案中完成度最高的选择之一。
关于 OpenClaw 的演化
README 中提到 hermes claw migrate 命令支持从 OpenClaw 迁移。这说明 Hermes Agent 在某种程度上继承了 OpenClaw(此前社区流行的开源 Agent 框架)的用户基础。迁移支持包括 SOUL.md 人格文件、记忆、Skills、API 密钥、消息平台配置等,降低了存量用户的切换成本。
6. 客观评价:优势与局限
优势
- 自学习闭环是当前 Agent 领域的稀缺能力。无论是 Claude Code 还是 Cursor,都缺乏 Skill 自动创建和自我改进的能力。
- 模型无关设计避免了供应商锁定。在 LLM 价格战日益激烈的当下,能随时切换到性价比最优模型的价值不可低估。
- MIT 开源意味着可以完全自主部署,数据不出域。对数据敏感的企业场景尤为重要。
- 活跃的社区生态------68+ 相关仓库、4,095+ commits、8 个 Release,证明这不是 demo 级项目。
- agentskills.io 标准正在成为跨平台 Skill 交换协议,增强了 Hermes 生态的网络效应。
局限
- 不是专门的编程 Agent------在纯代码生成和代码理解的深度上,可能不如 Claude Code 等专门针对编程场景优化的工具。
- 自部署门槛------需要自行管理服务器、模型 API 密钥、消息平台 Bot 配置,对非技术用户不友好。
- 项目相对年轻------2025 年 7 月创建,至今不到 1 年。虽然迭代很快,但长期稳定性和向后兼容性有待时间验证。
- Windows 原生不支持 ------需要 WSL2,且 Android(Termux)的
.[all]依赖存在兼容问题。 - 自学习质量的不确定性------Skill 自动创建和 Memory 自动合并的质量依赖于底层 LLM 的判断力。用弱模型时,自学习效果可能打折。
- RL 训练闭环的实际门槛------虽然内置了 Atropos 集成,但真正跑通 RL 训练需要 GPU 资源和较深的 ML 背景,对普通用户更像是画饼。
安全机制概述
作为一个具备命令执行权限的自主 Agent,Hermes 的安全设计值得单独审视:
- 命令审批机制:用户可配置命令白名单/黑名单,Agent 执行高风险命令前需获得用户批准
- DM Pairing:消息平台对话需要配对验证,防止未授权用户向 Agent 发送指令
- Memory 安全扫描:写入 Memory 前检测 prompt injection、凭证泄露等威胁模式
- Skill 安全扫描:外部 Skill 安装前检测数据泄露、破坏性命令等风险
- 容器隔离:6 种终端后端中,Docker/Singularity/Daytona/Modal 提供不同级别的沙箱隔离
- 社区方案 hermesclaw:第三方项目基于 NVIDIA OpenShell 提供硬件级网络/文件系统/系统调用策略
但需要指出的是,安全架构的完备性和实际效果之间可能存在差距------15+ 平台接入意味着攻击面不小,自主执行命令的 Agent 在实际部署中的安全风险不可忽视。
性能基准现状
截至调研时间,Hermes Agent 官方未公布标准化性能基准数据(如任务成功率、端到端延迟、token 消耗对比等)。社区中也缺乏系统化的第三方 benchmark。这是项目成熟度方面的一个短板------对于考虑在生产环境使用 Hermes 的团队来说,缺乏量化性能数据意味着评估成本较高。
需要持续关注的风险
- 可持续性:Nous Research 通过 Nous Portal 实现了一定程度的商业化,但与 Anthropic、OpenAI 等公司的资源规模差距悬殊。79,900 Stars 的维护压力是否可持续?
- 安全性:尽管有多层安全机制,15+ 平台接入 + 自主命令执行的攻击面仍然很大。实际部署中需要额外的安全审计。
- 生态碎片化:社区项目已经开始出现分支(hermesclaw、hermes-agent-lite、u-hermes),长期可能导致兼容性问题。
7. 总结:Hermes Agent 在 Agent 格局中的位置

如果用一张定位图来理解 Hermes Agent:
- 横轴:专用(纯编程)← → 通用(全场景)
- 纵轴:无状态 ← → 有学习能力
Claude Code、Cursor、Copilot 聚集在左侧偏下区域(专用 + 配置级记忆);AutoGPT 位于右侧中部(通用但学习系统化程度有限);Hermes Agent 位于右上象限(通用 + 系统化自学习闭环)。需要说明的是,这是简化的定位模型------AutoGPT 等项目也具备一定的记忆和学习能力,但在 Skill 自动创建、自我改进、RL 训练闭环等方面的系统化程度不如 Hermes。
这个定位既是优势也是风险。优势是差异化明显,系统化自学习闭环目前缺乏直接对标。风险是通用 Agent 的市场教育成本远高于编程助手------用户知道怎么用 Copilot 写代码,但不知道怎么让 Agent "帮自己管日程 + 写代码 + 巡检服务器 + 发飞书通知"。
从技术趋势看,Hermes Agent 代表了 AI Agent 发展的一个重要方向:从工具到智能体的跃迁。当 Agent 具备了持久记忆、自学习能力和多平台触达能力后,它就不再是一个"用完即走"的工具,而是一个"越用越懂你"的协作伙伴。
这个方向是否会成为主流?取决于两个条件:
- 底层 LLM 的推理能力是否足以支撑高质量的自学习(自动创建的 Skill 是否真的有用)
- 用户是否愿意为"自主 Agent"付出信任成本(把命令执行权交给 AI)
无论最终答案如何,Hermes Agent 至少在架构完整性和功能覆盖面上证明了:开源社区可以构建出与商业 Agent 产品同级别的系统设计。当然,从"架构完整"到"生产可靠"之间还有距离------稳定性、易用性和长期维护仍是开源项目的传统短板。但对于希望拥有数据自主权、不想被单一模型厂商锁定的团队来说,Hermes Agent 是目前架构完整度最高的开源 Agent 方案之一------但生产就绪度仍需团队结合自身场景自行验证。