OpenClaw刚火,Hermes Agent又爆了:AI正在发生一个关键变化!

OpenClaw刚火没多久,Hermes Agent又爆了。

说实话,这次我真觉得自己慢了半拍。

3月份在X上刷到它的时候,我点进GitHub看了一眼: "又一个Agent框架。"

然后我就关掉了。

直到发这篇文章前,我又看了一眼------38k stars,还在涨。

推特、Reddit、各种技术社区,到处都在讨论。

我才反应过来,不是它在跟风,是我看走眼了。

我是子昕。

这几天我专门花时间,把 Hermes Agent 和Anthropic、OpenAI关于 Harness Engineering 的文章都啃了一遍。

最后搞明白了一件事:

Hermes Agent之所以爆火,不是因为它更强,而是因为它代表了一个新方向:

AI,开始学会给自己造"缰绳"了。

这篇文章,我想把这事儿讲清楚。

先说清楚:什么是Harness Engineering?

在聊Hermes Agent之前,必须先搞懂一个词:Harness Engineering(驾驭工程)。

这个词是Anthropic和OpenAI在26年初提出的,现在正在成为AI工程领域的新关键词。

但它到底是什么意思?

先别被这个词吓到。

你可以把它理解成一句人话:

不是让AI更聪明,而是让AI更可控。

一个更直观的类比

想象你有一匹马:

  • 跑得很快(模型能力很强)
  • 但不太听话(容易跑偏)

以前我们的做法是:

  • 拼命写提示词(Prompt Engineering)
  • 告诉它:往左、往右、停下来

但问题是:

一旦任务变复杂,这种"喊话式控制"就失效了。

现在的做法变了:

给它套上一整套"马具"(Harness)

这个马具不是限制它,而是:

让它在可控范围内,稳定发挥能力

所以 Harness Engineering 本质在干嘛?

一句话总结:

不优化模型本身,而是优化模型运行的环境。

具体怎么做?

可以拆成 5 个组件(你不用死记,但理解很关键):

  1. 指令层(做什么) :清晰定义任务目标
  2. 约束层(不能做什么) :设定边界,防止跑偏
  3. 反馈层(做得对不对) :让AI知道哪里错了,及时纠正
  4. 记忆层(记住什么) :避免每次都从零开始
  5. 编排层(怎么协作) :协调多个任务或多个Agent

把这5个东西组合起来,本质就是:

给AI一套"长期工作"的操作系统

为什么这件事现在突然重要了?

因为:AI已经强到"容易失控"了。

Anthropic在他们的实验中发现,即使是最强的模型(Opus 4.5),在没有Harness的情况下,让它自主开发一个完整的Web应用,也会出现这些问题:

  • 一口气想做太多:试图一次性把所有功能都实现,结果context用完了,代码写了一半就卡住了
  • 过早宣布胜利:做了几个基础功能,看了一眼就觉得"差不多了",宣布任务完成
  • 不记得之前做了啥:每次context重置后,上一轮做的事情全忘了,又要从头猜

换句话说:

不是它不够强,而是它不稳定。

OpenAI在他们的实验中更激进:他们让AI Agent完全自主开发一个百万行代码的产品,人类完全不写代码,只设计Harness

结果是:只要Harness设计得好,Agent真的能做出能用的东西。

所以现在整个行业在做一件事:

不是让AI更聪明,而是让AI"靠谱"。

而 Hermes Agent 做了一件更激进的事:

它不只是给AI套缰绳,而是让AI自己学会造缰绳。

下面我们具体讲,它是怎么做到的。

Hermes Agent:第一个把"套缰绳"做成产品的

现在说回Hermes Agent。

Hermes Agent是Nous Research开发的开源AI Agent框架,2月份才发布,现在GitHub上已经38k stars。

它火的原因不是因为它又做了一个"能调工具的Agent"------这种东西现在一抓一大把。

它火,是因为它第一个把Harness Engineering的理念产品化了,而且做了一件更疯狂的事:让Agent自己给自己造缰绳

Hermes Agent到底是什么?

用一句话说:Hermes Agent是一个会自我进化的AI Agent框架

这是什么意思?

普通的Agent,你给它一个任务,它执行完就结束了。下次再来,它还是从零开始,你又得重新教它一遍。

Hermes Agent不一样。它会:

  • 记住你的偏好:你喜欢什么样的代码风格、什么样的沟通方式
  • 总结方法论:完成任务后,自动把"怎么做"提炼成Skill文件
  • 自我改进:根据你的反馈,自动修改自己的行为规范

用人话说:它越用越聪明,越用越懂你

Hermes Agent:它到底"会成长"在哪里?

前面说的都比较抽象,我们直接看一个真实场景。

假设你让 Hermes Agent 做一件很常见的事:

把一个项目部署到服务器上。

第一次:它其实也会"犯错"

第一次做的时候,它和普通Agent差不多:

  • 会试错
  • 会踩坑
  • 可能端口冲突、环境变量没配好
  • 甚至中间还会卡住

这很正常。

但关键不在这里。

不一样的地方,从"做完之后"开始

普通Agent流程是这样的:

复制代码
做完 → 结束 → 下次重新来

Hermes Agent不是。

它在完成任务后,会多做一步:

复盘:我刚刚是怎么做成这件事的?

然后,它会把这个过程,自动总结成一份"操作说明书"。

第二次:它开始"少犯错"

当你下次再让它做类似的事情时,它会:

  • 想起上次端口冲突的问题
  • 记得你用的是哪种服务器(比如DigitalOcean)
  • 按照自己总结的流程一步步执行

结果就是:

它不再是"重新做一遍",而是"复用经验"。

第三次之后:它开始"像个人了"

更关键的是,如果你中间给它反馈:

"你写的部署脚本,注释太少了。"

它不会只改这一次。

它会做一件更狠的事:

直接修改自己的"做事规则"。

比如在它的"写代码流程"里,加上一条:

  • 所有函数必须有清晰注释

从这一刻开始:

它以后写的所有代码,都会自动符合你的要求。

拆开来看,Hermes到底做了哪三件事?

上面这个过程,其实对应三个核心能力:

1、学习循环:它会复盘

不是做完就结束,而是:

做完 → 总结 → 变成经验 → 下次直接用

2. 三层记忆:它真的"记得住"

  • 短期记忆:这次任务发生了什么
  • 长期记忆:你的习惯、偏好
  • Skill记忆:怎么把事情做好

组合起来就是一句话:

它不是记住答案,而是记住"你是谁 + 事情该怎么做"。

3. Skill自进化:它会改自己的行为

传统Agent:

规则 = 人写的

Hermes Agent:

规则 = 自己总结 + 根据反馈自动修改

一句话总结 Hermes 的本质

如果只用一句话说清楚它在干嘛:

普通Agent是在"完成任务",而Hermes是在"积累经验"。

这也是为什么它会爆火:

它不只是一个工具,而是一个会越来越懂你的"长期助手"。

Hermes Agent vs OpenClaw:本质区别是什么?

很多人会问:Hermes Agent和OpenClaw有什么区别?为什么OpenClaw火了之后,Hermes还能火起来?

答案是:它们解决的根本不是同一个问题

OpenClaw:配置即行为

OpenClaw的核心理念是"配置即行为"。

你写一个SOUL.md配置文件,定义Agent的性格、行为规范、工作流程,然后Agent照着配置执行。

OpenClaw的核心价值是:可预测、可审计、可复制

你知道它会做什么,不会做什么。所有行为都写在配置里,清清楚楚。这对企业场景特别重要,因为企业需要的是标准化、可控的流程。

类比:OpenClaw像给员工写SOP(标准操作流程),他们照着做就行。

Hermes Agent:自我进化

Hermes Agent的核心理念是"自主学习"。

你不需要事先写好所有规则。Agent会在使用过程中自己总结规则,自己优化行为

Hermes的核心价值是:自主性、能学习、会成长

它适合的是那些需要长期积累、持续优化的任务。你不想反复教它做事,你想培养一个"懂你"的助手。

类比:Hermes像培养一个实习生,他会从错误中学习,越来越靠谱。

对比表:关键区别

我整理了一个对比表,把核心差异列出来:

维度 OpenClaw Hermes Agent
核心概念 配置即行为(SOUL.md 自我进化学习循环
记忆 跨会话记忆 三层记忆(会话+持久+Skill)
Skill维护 手动编写和维护 Agent自动创建和改进
用户建模 不做用户建模 Honcho系统推断用户偏好
多平台访问 Gateway网关,50+平台 Gateway网关,12+平台
生态规模 ClawHub 49000+社区Skill MCP生态 6000+ + 40+内置工具
部署方式 本地/Docker/VPS/云托管 本地/Docker/VPS
Skill互通 agentskills.io标准 agentskills.io标准

看完这个表,你可能会发现一个有意思的事:它们不是竞争关系,而是互补的

  • OpenClaw强调"连接一切",让你在各种平台上统一调用Agent
  • Hermes强调"自我成长",让Agent在使用中越来越懂你

如果用工具做比喻:

  • OpenClaw是"瑞士军刀":标准化、多功能、可预测
  • Hermes是"学徒":会学习、会成长、越用越顺手

而且,这两个项目都采用了agentskills.io标准,Skill文件是可以互通的。也就是说,你在Hermes上积累的Skill,可以导入到OpenClaw;反过来也一样。

这对普通人意味着什么?

讲了这么多技术细节,我们把问题说得更直接一点:

这跟你有什么关系?

以前我们用AI,是这样的:

  • 打开ChatGPT
  • 问一个问题
  • 得到答案
  • 关闭

下次再用:

从零开始。

但现在,这件事开始变了。

像 Hermes Agent 这样的系统,本质上在做一件事:

让AI"记住你",并且在使用中不断变得更懂你。

换句话说:

AI正在从"工具",变成"可以培养的助手"。

这个变化有多大?

你可以这样理解:

以前:

你在用一个搜索引擎

现在:

你在培养一个长期为你工作的"人"

而这个"人":

  • 会记住你的习惯
  • 会总结你的工作方式
  • 会根据你的反馈不断改进

而且,24小时在线。

一个更现实的问题

如果这件事成立,会发生什么?

最直接的影响是:

未来的差距,不只是"你会不会用AI",而是------
你有没有"训练出一个属于自己的AI"。

有人还在:

  • 每天重复写提示词
  • 每次从头教AI做事

也有人已经在:

  • 积累自己的Skill
  • 让AI越来越懂自己的工作方式

这两种人,半年之后的效率差距,会非常夸张。

我自己的判断

说实话,我现在越来越觉得:

Harness Engineering,很可能是2026年最重要的一个AI工程关键词。

我们过去几年,一直在优化三件事:

  • Prompt(提示词)
  • Context(上下文)
  • Model(模型能力)

但现在,重心在发生变化:

从"怎么用AI",变成"怎么让AI稳定地为你工作"。

而 Hermes Agent,只是一个开始。

写在最后

这篇文章只是第一篇,先把一件事讲清楚:

AI,正在从"听话",走向"自我约束"。

接下来我会继续实测:

  • 实际部署 Hermes Agent
  • 看它的"自我学习"到底有多靠谱
  • 对比 OpenClaw 和 Hermes 的真实使用体验

如果你也在关注这条线,可以点个关注。

我会把踩过的坑、真实体验,一点点写出来。

更多内容,欢迎关注微信公众号【子昕AI编程】~

相关推荐
汤面不加鱼丸2 小时前
Vibe Coding初体验之Trae CN
ai编程
迷途酱2 小时前
告别"玩具项目":用 MCP 协议让你的 AI Agent 真正干活
ai编程·mcp
Light603 小时前
源码泄露VS工业革命:Claude Code与领码SPARK VIEW的AI编程范式对决
ai编程·配置即代码·源码泄露·claude code·spark view·技术范式
小手智联老徐3 小时前
OpenClaw 三小时连更三个版本
llm·ai编程·openclaw
与虾牵手3 小时前
OpenClaw 省钱方案:2026 年我把 Claude Code 的开销砍掉 70% 的完整配置
ai编程·claude
sickworm陈浩3 小时前
为 300W 行的安卓老工程落地可迭代的 AI 知识库
android·ai编程
Java老刘3 小时前
Spring AI + Chroma 如何搭建汽车客服知识库问答系统
spring boot·ai编程
木子予彤3 小时前
Android 性能诊断 V2:基于 Agent Skill 的原生 IDE 融合架构
android·ai编程
摇滚侠3 小时前
从 Vibe Coding 到 Spec Coding:研发范式演进与高质量交付
java·人工智能·ai编程