Hermes Agent 从入门到企业实战-01:Hermes-Agent核心架构

第 1 章:Hermes Agent 核心架构:自进化 Agent 五大模块

🎯 本章目标:读完这一章,你就能跟别人讲清楚 Hermes Agent 是个什么东西,它凭什么 2 个月涨到 5 万星。


1.1 项目背景:Nous Research 与开源 AI Agent

先说说"爸爸"是谁

Hermes Agent 的开发团队叫 Nous Research,这是个美国的开源 AI 研究实验室。

你可能没听过这个名字,但你大概率听过他们的核心人物------Teknium。这哥们之前是 OpenAI 的,后来出来单干,搞了一堆开源模型,比如 Hermes 系列大模型(Hermes-2、Hermes-3 等),在开源圈名气很大。

2026 年 2 月,他们发布了 Hermes Agent,口号是:

"The agent that grows with you"(与你共同成长的 Agent)

翻译成人话:这不是一个用完就扔的工具,而是一个越用越聪明的 AI 搭档。

为什么突然火了?

两个原因:

  1. 时机好:2026 年初,AI Agent 概念正火,但大多数 Agent 要么太复杂(配置一堆东西),要么太傻(记不住事)。Hermes 刚好在"简单"和"智能"之间找到了平衡点。
  2. 理念新:它提出了"自进化"的概念------Agent 会根据你的使用自动学习、创建技能、改进自己。这个卖点太戳人了。

结果就是:2 个月,GitHub 星标从 0 涨到 5 万+,成为 2026 年上半年最火的开源 AI Agent 项目。


1.2 核心理念:自进化 AI Agent

一句话概括 Hermes Agent

Hermes Agent 是一个会自己"长脑子"的 AI 助手。

传统 AI 助手(比如 ChatGPT)是这样的:

  • 你问它问题,它回答
  • 下次再问,它不记得上次聊了啥
  • 你得每次重新解释背景

Hermes Agent 不一样:

  • 你跟它说"帮我写代码",它写了
  • 下次你再说"帮我写代码",它记得你上次用什么框架、什么风格
  • 再下次,它已经帮你写好了一个 Skill(技能包),专门处理"写代码"这个任务
  • 越用越顺手,越用越懂你

它和 OpenClaw 有什么区别?

对比维度 OpenClaw Hermes Agent
设计理念 你配置它做什么,它就做什么 你用它做什么,它就学会做什么
类比 一把精密的瑞士军刀 一个会成长的学徒
Skill 维护 你自己写、自己维护 Agent 自动创建、自动改进
记忆 你手动维护记忆文件 自动沉淀,越用越聪明

简单说:

  • OpenClaw = 配置出来的好助手
  • Hermes = 养出来的好搭档

没有绝对的好坏,看你想要"可控"还是"进化"。


1.3 五大核心模块概览

Hermes Agent 由 5 个核心模块组成。不用死记硬背,理解就行:

复制代码
┌─────────────────────────────────────────────────────────────┐
│                      Hermes Agent                            │
├─────────────┬─────────────┬─────────────┬─────────────────────┤
│   学习循环   │   三层记忆   │  Skill系统  │  40+工具 + MCP     │
│   (心脏)    │   (大脑)    │  (招式库)   │     (手脚)         │
├─────────────┴─────────────┴─────────────┴─────────────────────┤
│                    多平台 Gateway (门脸)                      │
│         微信 | 飞书 | 钉钉 | Telegram | Discord ...          │
└─────────────────────────────────────────────────────────────┘

1.3.1 学习循环(心脏)------ 让 Agent 越用越聪明

这是 Hermes 最核心的创新,官方叫 Learning Loop(学习循环)

传统 AI 是"一次性的":你问,它答,结束。下次再问,它不记得。

Hermes 的学习循环是这样的:

复制代码
策划记忆 → 自主创建Skill → Skill自改进 → FTS5跨会话召回 → 用户建模
    ↑                                                        ↓
    └────────────────────── 飞轮效应 ────────────────────────┘

说人话版本

  1. 策划记忆:每次任务完成后,Agent 会"复盘"------这次任务做了什么、有什么可以改进的
  2. 自主创建 Skill:如果发现某个任务经常做,Agent 会自动创建一个 Skill(技能包),下次直接用
  3. Skill 自改进:Skill 用多了,Agent 会根据反馈自动优化它
  4. 跨会话召回:下次遇到类似任务,Agent 会"想起"之前怎么做的
  5. 用户建模:Agent 会推导你的偏好、习惯,越来越懂你

飞轮效应:用得越多,每个环节同时变强。就像滚雪球,越滚越大。

1.3.2 三层记忆(大脑)------ 记住你的一切

Hermes 的记忆分三层,对应人类的认知科学:

记忆类型 存什么 存哪里 类比
会话记忆 "发生了什么" SQLite + FTS5 你今天干了啥
持久记忆 "你是谁" SQLite 你的性格、偏好
Skill 记忆 "怎么做事" ~/.hermes/skills/*.md 你的技能、经验

关键点

  • 会话记忆是按需检索的,不是全量加载(省 token)
  • 持久记忆是跨会话保持的,下次启动还在
  • Skill 记忆是可自改进的 markdown 文件,你能直接看到、直接改

1.3.3 Skill 系统(招式库)------ Agent 的技能包

Skill 是什么?

简单说,Skill 就是一个 markdown 文件,里面写着:

  • 什么时候触发这个 Skill
  • 触发后怎么行动
  • 有什么注意事项

Skill 的三种来源

来源 说明
Bundled Skills Hermes 自带的,40+ 个,开箱即用
Agent 自主创建 Agent 根据任务自动生成的
Skills Hub 社区 社区贡献的,可以下载安装

Skill 的核心差异

传统 Agent 的 Skill 是人写的,写完就不变了。

Hermes 的 Skill 会自改进------如果你给反馈说"这个 Skill 不好用",Agent 会自动修改 Skill 文件,下次就变好了。

1.3.4 40+ 工具与 MCP(手脚)------ Agent 能干什么

Hermes 内置了 40+ 工具,分五大类:

类别 工具举例 能干什么
执行类 terminal, code_execution, file 执行命令、写代码、操作文件
信息类 web, browser, session_search 搜索网页、浏览网站、搜索历史
媒体类 vision, image_gen, tts 看图、生图、语音合成
记忆类 memory, skills, todo, cronjob 管理记忆、技能、待办、定时任务
协调类 delegation, moa, clarify 委派子任务、多 Agent 协作、澄清需求

MCP 是什么?

MCP(Model Context Protocol)是一个标准,让 Hermes 能接入外部工具。

目前 MCP 生态有 6000+ 外部应用,比如:

  • Google Drive、Notion、Slack
  • GitHub、GitLab
  • 各种数据库、API

关键点:你可以按需启用工具,不需要的全关掉,省 token,也更安全。

1.3.5 多平台 Gateway(门脸)------ 在哪里用 Hermes

Gateway 是 Hermes 的"消息网关",让你能在各种平台上跟 Hermes 聊天。

官方支持 12+ 平台

平台类型 平台名称
国际平台 Telegram, Discord, Slack, WhatsApp, Signal
国内平台 微信(原生支持), 飞书, 钉钉, 企业微信

关键特性

  • 跨平台对话连续性:你在微信上聊到一半,切到飞书继续聊,Hermes 记得上下文
  • 共享同一个 Agent 实例:所有平台连的是同一个 Hermes,记忆共享

1.4 与 OpenClaw、Claude Code 等框架对比

快速对比表

维度 Hermes Agent OpenClaw Claude Code
核心理念 自进化学习循环 配置即行为 AI 编程助手
记忆系统 三层自改进 多层,人工维护 会话级,不持久
Skill 维护 Agent 自动创建+改进 人工编写维护 无 Skill 概念
生态规模 40+ 内置 + MCP 6000+ ClawHub 5700+ 官方插件
消息平台 12+ 平台 50+ 平台
部署方式 自托管(VPS $5/月起) 官方托管/自托管 云端
开源协议 MIT(完全开源) MIT 不开源

怎么选?

你的需求 推荐
想要一个"越用越聪明"的 AI Hermes
想要精确控制 Agent 的行为 OpenClaw
主要用来写代码 Claude Code
想接入更多消息平台 OpenClaw
想用国产模型,不想翻墙 OpenClaw 或 Hermes + 国产模型

1.5 适用场景与用户画像

Hermes Agent 适合谁?

用户类型 适合程度 原因
个人开发者 ⭐⭐⭐⭐⭐ 自进化特性最适合个人长期使用
AI 爱好者 ⭐⭐⭐⭐⭐ 折腾乐趣多,每版都有新功能
小团队 ⭐⭐⭐⭐ 可以共享 Agent,但权限控制不如 OpenClaw
企业用户 ⭐⭐⭐ 安全审计不如 OpenClaw 成熟,但可用
完全小白 ⭐⭐ 需要一定技术基础(Linux 命令行)

典型使用场景

场景 Hermes 能干什么
日常聊天/问答 像 ChatGPT 一样聊天,但会记住你的偏好
编程辅助 写代码、Review 代码、自动创建编码 Skill
自动化任务 定时爬取网站、自动生成报告、自动发消息
知识管理 自动整理对话、生成知识库、LLM Wiki
多平台客服 一个后台,多平台接入,记忆共享

本章小结

恭喜你,读到这里,你已经能回答"Hermes Agent 是什么"了:

  1. 是谁开发的:Nous Research,开源 AI 研究实验室
  2. 核心理念:自进化 AI Agent,越用越聪明
  3. 五大模块:学习循环、三层记忆、Skill 系统、40+ 工具、多平台 Gateway
  4. 和 OpenClaw 的区别:OpenClaw 是"配置出来的",Hermes 是"养出来的"
  5. 适合谁:个人开发者、AI 爱好者、小团队

下一章预告

下一章,我们来聊聊 Hermes Agent 的版本演进,看看它从 v0.1.0 到 v0.10.0 都经历了什么变化,帮你选一个合适的版本。


💡 小贴士:如果你想跳过概念,直接上手,可以跳到第 3 章,从 WSL2 安装开始。概念可以边用边理解。

相关推荐
深圳市晶科鑫实业有限公司1 小时前
国产TCXO温补晶振是否可以完美替代欧美日系主流型号
人工智能·stm32·单片机·物联网·51单片机·信息与通信
cyyt1 小时前
深度学习周报(6.8~6.14)
人工智能·深度学习
带娃的IT创业者1 小时前
深度解析:当 MLX 遇上视觉语言模型,Mac 本地推理的新范式
人工智能·macos·语言模型·视觉语言模型·apple silicon·mlx·mac本地推理
沪漂阿龙1 小时前
LangChain 系列之Tools:让大模型真正连接业务系统
人工智能·python·langchain
竹叶青lvye1 小时前
ROS2自定义接口消息、参数服务案例
人工智能·ros2·具身智能·接口消息·参数服务
AI科技星1 小时前
数术工坊·第八卷 大道归一录・番外・下篇 零界封神・万法归元终章
网络·人工智能·算法·几何学·拓扑学
GZ_TOGOGO1 小时前
Spring AI Alibaba 格式化输出
java·人工智能·spring
Keller-Zhou1 小时前
门店巡检AI图像识别系统技术架构设计
人工智能