Hermes Agent 一周暴涨五万 Star,但我劝你别急着追

给在 AI Agent 热浪里刷 GitHub Trending 刷到焦虑的开发者:这篇不评测 Hermes,而是聊一个更值得你花时间的问题------追工具还是建体系。

一周五万 Star,发生了什么

上周打开 GitHub Trending 周榜,我盯着第二名的数字看了三遍:

NousResearch/hermes-agent --- 一周 +53,110 Star,总 Star 91.1K。

两个月不到,从建仓到九万星。这个增长速度意味着什么?做个对比:LangChain 花了差不多一年才到这个量级,AutoGen 用了半年多。Hermes 用了不到八周。

社区炸了。Reddit 上 "I switched from OpenClaw to Hermes" 隔几天就冒一条,HN 搜 "hermes agent" 出来 50 多条讨论,国内技术群里也开始传"下一个必学框架"。

如果你跟我一样,看到这种数据会本能地点进去、读文档、开始考虑"要不要把现有项目迁过去"------这篇文章就是写给你的。

但我想先说:别急。

Hermes Agent 到底是什么

先讲清楚它到底在做什么,再聊要不要追。

Hermes Agent 是 Nous Research 开源的一个通用 AI Agent 框架,MIT 协议。核心卖点:

特性 说明 你可能关心的
自我改进循环 执行任务后自动总结经验,编码成可复用 Skill 听起来很酷,但有坑(后面说)
跨会话记忆 不像多数框架"一次对话一世界" 对长期项目有吸引力
15+ 平台网关 Telegram、Slack、Discord、Web 开箱即用 集成成本确实低
模型无关 Claude、GPT、Gemini、本地模型都能接 不绑死供应商
版本狂飙 42 天内发了 9 个版本(最新 v0.9.0) 迭代快 = 接口也在快速变动

客观说,这些特性确实踩中了当前 Agent 开发的几个痛点。跨会话记忆和自我改进循环,是很多开发者手动实现过的东西,有人帮你框架化了,当然有吸引力。

但我要泼两盆冷水。

冷水一:增长数字背后的疑点

Hermes Agent 背后是 Nous Research------一家从 Web3 起步 的公司。CEO 来自以太坊 MEV 项目,Series A 用的是 token 估值(不是传统股权融资),Paradigm 领投 6500 万美元。

我对 Web3 没偏见,但这个背景叠加上爆炸式增长,社区已经开始质疑了:

Star 的水分问题。 Reddit 多条高赞帖指出:新注册账号集中发模板化推广帖,措辞高度雷同。有人直接用了"likely using bots"这个词。我没有证据说 Star 一定是刷的,但当一个项目两个月到九万星,保持合理怀疑不是坏事。

"自我改进"的根本缺陷。 这是我觉得最值得警惕的:Hermes 的 Agent 会在完成任务后自动评估结果、把经验编码成 Skill。问题是------Agent 几乎总是认为自己做对了。即使实际输出有错,它也会把错误的"经验"固化下来。Power user 管这叫"噩梦":你手动改好了一个 bug,下次 Agent 又按旧 Skill 把错误改回去。

Token 开销问题。 有人测过,Hermes 每次 API 调用大约 73% 是固定开销(约 13.9K tokens 用于加载上下文和 Skill 库),真正干活的只占小头。对于个人开发者来说,这个 token 税不便宜。

我不是说 Hermes Agent 一定有问题。它的技术方向------持久记忆、自我改进------确实是 Agent 框架需要解决的真命题。但当增长速度远超技术成熟度的时候,至少该观望一下。

冷水二:你追得完吗

打开 GitHub 的 ai-agent Topic 页面:

9,900 个仓库。

随便列几个 2026 年上半年"你应该关注"的 Agent 框架:LangGraph、CrewAI、AutoGen、LlamaIndex Agents、Mastra、Haystack、FastAgency、Semantic Kernel、Phidata、Composio、Multica...... 有人做过统计,至少 25 个以上进入过 Trending 或者被正经技术媒体推荐过。

每一个框架发布时的话术都长这样:

"We fundamentally rethought agent architecture."

"10x faster than XX, 3x cheaper than YY."

"The only agent framework you'll ever need."

然后一个月后,另一个框架冲上 Trending,上个月的"唯一框架"已经没人提了。Reddit 上甚至开始出现反趋势的帖子:"I Stopped Using Frameworks --- AI Agents Do It All Now."

这不叫技术进步。这叫框架疲劳(Framework Fatigue)。

现象 数据
GitHub ai-agent 仓库数 9,900+
2026 上半年主流 Agent 框架 25+
常见生产事故 重复调用 API、幻觉策略、死循环、覆盖用户编辑
反趋势信号 "停止使用框架"类帖子开始高赞

说句实在话,我自己就是过来人。2025 年底到 2026 年初,LangChain → AutoGen → CrewAI → OpenClaw,一个不落。每换一个框架,之前写的适配代码、踩过的配置坑、积累的调试经验就全废了。转头一看,半年过去了,我的实际产出并没有因为"用了更好的框架"而变多。

真正的问题不是"用什么框架"

METR(一个专注 AI 能力评估的研究机构)今年做了一项实验,结论给我当头一棒:

有经验的开发者使用 AI 工具后,实际完成任务反而慢了 19%。但他们自己觉得快了 20%。

这是什么概念?AI 工具(包括 Agent 框架)制造了一种效率幻觉------你觉得自己在飞速产出,但算上学框架的时间、调试 Agent 行为的时间、修 Agent 幻觉的时间,总成本反而更高了。

不止是 Agent 框架。整个 "Vibe Coding" 运动的反噬数据也触目惊心:

指标 变化
代码 churn(改了又改的比率) +41%
代码重复度 ×4
健康重构占比 从 25% 暴跌到 <10%
安全公司测试 15 个 vibe coding 应用 69 个漏洞,6 个 Critical 级
Apple 动作 已封禁多款 vibe coding 生成的应用

Addy Osmani------Chrome 团队工程负责人,在开发者社区影响力很大------分享了他的 AI 编程工作流。里面没有一条是关于"选对框架"的,全是工程纪律:

  1. 先写 spec.md 做人工规划,想清楚再让 AI 动手
  2. 拆小任务,每个任务的边界清晰到 AI 不会"发挥"
  3. 喂充分上下文,别让 AI 猜你要什么
  4. 人类始终在监督位,不要让 AI 无人值守跑 30 分钟
  5. 超频 commit,每个小步骤都提交,出问题能回滚

Stack Overflow 也在今年发布了 agents.md 规范指南,核心结论跟 Osmani 一样:

AI 放大的是你已有的工程纪律,不是替代它。

你花在"搞清楚 Hermes Agent 怎么配置自我改进循环"上的三天,大概率不如花在"让 AI 更好地理解你已有的代码"上。

与其追工具,不如建体系

这不是鸡汤。我掉进过这个坑,现在爬出来了,分享一下我现在怎么想这件事。

我维护了 10 年的 C++ 技术栈,26 个核心模块,10 万行代码。网络层、协议解析、配置管理、渲染引擎------这些模块不管外面 Agent 框架怎么更新换代,它们的工程价值不会归零。

框架会过时,但你的代码资产不会。

真正值得投入的事情只有三件:

1. 搞清楚你有什么

你的技术栈里有哪些成熟模块?哪些可以让 AI 直接复用?哪些有技术债需要先清理?如果这些问题你答不上来,换再多框架都是瞎折腾。

我之前做了一个工具叫 repo-scan,就是干这个的------用 AI 交叉审计你的代码库,帮你理清家底。让 Claude 和 GPT 分别扫描,交叉比对,找出你自己都忘了的宝贝模块和隐藏的技术债。

2. 从八十分开始,别从零开始

上一篇文章《受够了 Vibe Coding 的失控?换个起点,让 AI 事半功倍》我详细聊过这个方法论:与其让 AI 从零写 2000 行代码(3 处幻觉 API,改了一下午),不如用你的成熟模块搭好 80% 骨架,AI 只补最后 20% 的胶水代码(零幻觉,30 分钟合并)。

我正在做的 GufaForge 就是这个思路的产品化------扫描你的成熟模块库,根据新项目需求自动装配骨架,生成 AI 可直接执行的装配清单。工具还在完善中,完成后会开源,感兴趣的可以先关注公众号「海滨code」,第一时间通知。

3. 建立框架无关的工程纪律

不管你最终选 Hermes、OpenClaw 还是裸写 Claude Code,这些纪律不因框架而变:

  • 规划和执行分离------人做规划,AI 做执行。别把两件事混在一起让 AI 自己发挥
  • 控制任务粒度------每轮让 AI 做一件具体的事,别让它无人值守跑半小时
  • 超频 commit------每完成一小步就提交,出问题能秒回滚
  • 写 spec 不写 prompt------与其花时间优化 prompt,不如花时间写清楚 spec.md

这套流程,你用什么框架都适用。框架挂了,流程还在。

所以,Hermes Agent 该不该学

该关注,但没必要急着 all-in。

  1. Star 它,Watch 它,等 3-6 个月看社区沉淀。 一个月后还有人认真写使用心得的框架,才值得花时间学。一个月后没人提的,现在学了也白学。
  2. 先把自己的家底理清楚。 你的代码资产、技术栈能力矩阵、AI 能直接复用的模块清单------这些搞不清楚,用什么框架都事倍功半。
  3. 建立框架无关的工作流。 spec.md → 拆任务 → 喂上下文 → 监督 → commit。这套流程不依赖任何框架,也不会因为哪个框架凉了而作废。
  4. 如果确实想试 Hermes,用一个小项目试。 别拿你的生产项目当实验场。

GitHub 上有 9,900 个 ai-agent 仓库。最终活下来不会超过 5 个。而你的精力,应该花在那些不随框架消亡的东西上。


"最好的 AI 工具,不是最新的框架,是让 AI 理解你已经有什么。"


关于作者:海滨code,10年+码农,曾任某互联网大厂技术专家。常年专注于原生应用和高性能服务器开发、视频传输和处理技术以及 AI 个人生产力研究。公众号「海滨code」,分享 AI 编程实战和个人技术体系建设。

作者 :海滨code | GitHub:haibindev | 个人主页

相关推荐
货拉拉技术2 小时前
# AI翻译:出海企业如何跨越“语言鸿沟”?
人工智能
IT科技那点事儿2 小时前
Fortinet 全面升级安全运营平台:全面整合云 SOC、智能体 AI、托管检测与响应及端点安全防护
人工智能·安全
Java面试题总结3 小时前
Spring AI 核心架构、抽象模型与四大核心组件设计精髓
人工智能·spring·架构
光影少年3 小时前
前端开发桌面端都有哪些框架?
前端·react.js·electron
云烟成雨TD3 小时前
Spring AI Alibaba 1.x 系列【20】MessagesAgentHook 、MessagesModelHook 相关实现类
java·人工智能·spring
Cecilialana3 小时前
同域名、同项目、仅 hash 变化,window.location.href 不跳转
前端·javascript
程序员小嬛3 小时前
中科院一区TOP:用于求解偏微分方程的物理信息神经网络前沿创新思路
人工智能·深度学习·神经网络·机器学习
霸道流氓气质3 小时前
SpringBoot中集成LangChain4j实现集成阿里百炼平台进行AI对话记忆功能和对话隔离功能
java·人工智能·spring boot·langchain4j
xiaotao1313 小时前
01-编程基础与数学基石:Matplotlib & Seaborn
人工智能·python·matplotlib