给在 AI Agent 热浪里刷 GitHub Trending 刷到焦虑的开发者:这篇不评测 Hermes,而是聊一个更值得你花时间的问题------追工具还是建体系。

一周五万 Star,发生了什么
上周打开 GitHub Trending 周榜,我盯着第二名的数字看了三遍:
NousResearch/hermes-agent --- 一周 +53,110 Star,总 Star 91.1K。

两个月不到,从建仓到九万星。这个增长速度意味着什么?做个对比:LangChain 花了差不多一年才到这个量级,AutoGen 用了半年多。Hermes 用了不到八周。
社区炸了。Reddit 上 "I switched from OpenClaw to Hermes" 隔几天就冒一条,HN 搜 "hermes agent" 出来 50 多条讨论,国内技术群里也开始传"下一个必学框架"。

如果你跟我一样,看到这种数据会本能地点进去、读文档、开始考虑"要不要把现有项目迁过去"------这篇文章就是写给你的。
但我想先说:别急。
Hermes Agent 到底是什么
先讲清楚它到底在做什么,再聊要不要追。
Hermes Agent 是 Nous Research 开源的一个通用 AI Agent 框架,MIT 协议。核心卖点:
| 特性 | 说明 | 你可能关心的 |
|---|---|---|
| 自我改进循环 | 执行任务后自动总结经验,编码成可复用 Skill | 听起来很酷,但有坑(后面说) |
| 跨会话记忆 | 不像多数框架"一次对话一世界" | 对长期项目有吸引力 |
| 15+ 平台网关 | Telegram、Slack、Discord、Web 开箱即用 | 集成成本确实低 |
| 模型无关 | Claude、GPT、Gemini、本地模型都能接 | 不绑死供应商 |
| 版本狂飙 | 42 天内发了 9 个版本(最新 v0.9.0) | 迭代快 = 接口也在快速变动 |
客观说,这些特性确实踩中了当前 Agent 开发的几个痛点。跨会话记忆和自我改进循环,是很多开发者手动实现过的东西,有人帮你框架化了,当然有吸引力。
但我要泼两盆冷水。
冷水一:增长数字背后的疑点
Hermes Agent 背后是 Nous Research------一家从 Web3 起步 的公司。CEO 来自以太坊 MEV 项目,Series A 用的是 token 估值(不是传统股权融资),Paradigm 领投 6500 万美元。
我对 Web3 没偏见,但这个背景叠加上爆炸式增长,社区已经开始质疑了:
Star 的水分问题。 Reddit 多条高赞帖指出:新注册账号集中发模板化推广帖,措辞高度雷同。有人直接用了"likely using bots"这个词。我没有证据说 Star 一定是刷的,但当一个项目两个月到九万星,保持合理怀疑不是坏事。
"自我改进"的根本缺陷。 这是我觉得最值得警惕的:Hermes 的 Agent 会在完成任务后自动评估结果、把经验编码成 Skill。问题是------Agent 几乎总是认为自己做对了。即使实际输出有错,它也会把错误的"经验"固化下来。Power user 管这叫"噩梦":你手动改好了一个 bug,下次 Agent 又按旧 Skill 把错误改回去。
Token 开销问题。 有人测过,Hermes 每次 API 调用大约 73% 是固定开销(约 13.9K tokens 用于加载上下文和 Skill 库),真正干活的只占小头。对于个人开发者来说,这个 token 税不便宜。

我不是说 Hermes Agent 一定有问题。它的技术方向------持久记忆、自我改进------确实是 Agent 框架需要解决的真命题。但当增长速度远超技术成熟度的时候,至少该观望一下。
冷水二:你追得完吗
打开 GitHub 的 ai-agent Topic 页面:
9,900 个仓库。

随便列几个 2026 年上半年"你应该关注"的 Agent 框架:LangGraph、CrewAI、AutoGen、LlamaIndex Agents、Mastra、Haystack、FastAgency、Semantic Kernel、Phidata、Composio、Multica...... 有人做过统计,至少 25 个以上进入过 Trending 或者被正经技术媒体推荐过。
每一个框架发布时的话术都长这样:
"We fundamentally rethought agent architecture."
"10x faster than XX, 3x cheaper than YY."
"The only agent framework you'll ever need."
然后一个月后,另一个框架冲上 Trending,上个月的"唯一框架"已经没人提了。Reddit 上甚至开始出现反趋势的帖子:"I Stopped Using Frameworks --- AI Agents Do It All Now."
这不叫技术进步。这叫框架疲劳(Framework Fatigue)。
| 现象 | 数据 |
|---|---|
| GitHub ai-agent 仓库数 | 9,900+ |
| 2026 上半年主流 Agent 框架 | 25+ |
| 常见生产事故 | 重复调用 API、幻觉策略、死循环、覆盖用户编辑 |
| 反趋势信号 | "停止使用框架"类帖子开始高赞 |

说句实在话,我自己就是过来人。2025 年底到 2026 年初,LangChain → AutoGen → CrewAI → OpenClaw,一个不落。每换一个框架,之前写的适配代码、踩过的配置坑、积累的调试经验就全废了。转头一看,半年过去了,我的实际产出并没有因为"用了更好的框架"而变多。
真正的问题不是"用什么框架"
METR(一个专注 AI 能力评估的研究机构)今年做了一项实验,结论给我当头一棒:
有经验的开发者使用 AI 工具后,实际完成任务反而慢了 19%。但他们自己觉得快了 20%。
这是什么概念?AI 工具(包括 Agent 框架)制造了一种效率幻觉------你觉得自己在飞速产出,但算上学框架的时间、调试 Agent 行为的时间、修 Agent 幻觉的时间,总成本反而更高了。
不止是 Agent 框架。整个 "Vibe Coding" 运动的反噬数据也触目惊心:
| 指标 | 变化 |
|---|---|
| 代码 churn(改了又改的比率) | +41% |
| 代码重复度 | ×4 |
| 健康重构占比 | 从 25% 暴跌到 <10% |
| 安全公司测试 15 个 vibe coding 应用 | 69 个漏洞,6 个 Critical 级 |
| Apple 动作 | 已封禁多款 vibe coding 生成的应用 |
Addy Osmani------Chrome 团队工程负责人,在开发者社区影响力很大------分享了他的 AI 编程工作流。里面没有一条是关于"选对框架"的,全是工程纪律:
- 先写
spec.md做人工规划,想清楚再让 AI 动手 - 拆小任务,每个任务的边界清晰到 AI 不会"发挥"
- 喂充分上下文,别让 AI 猜你要什么
- 人类始终在监督位,不要让 AI 无人值守跑 30 分钟
- 超频 commit,每个小步骤都提交,出问题能回滚
Stack Overflow 也在今年发布了 agents.md 规范指南,核心结论跟 Osmani 一样:
AI 放大的是你已有的工程纪律,不是替代它。
你花在"搞清楚 Hermes Agent 怎么配置自我改进循环"上的三天,大概率不如花在"让 AI 更好地理解你已有的代码"上。
与其追工具,不如建体系
这不是鸡汤。我掉进过这个坑,现在爬出来了,分享一下我现在怎么想这件事。
我维护了 10 年的 C++ 技术栈,26 个核心模块,10 万行代码。网络层、协议解析、配置管理、渲染引擎------这些模块不管外面 Agent 框架怎么更新换代,它们的工程价值不会归零。
框架会过时,但你的代码资产不会。
真正值得投入的事情只有三件:
1. 搞清楚你有什么
你的技术栈里有哪些成熟模块?哪些可以让 AI 直接复用?哪些有技术债需要先清理?如果这些问题你答不上来,换再多框架都是瞎折腾。
我之前做了一个工具叫 repo-scan,就是干这个的------用 AI 交叉审计你的代码库,帮你理清家底。让 Claude 和 GPT 分别扫描,交叉比对,找出你自己都忘了的宝贝模块和隐藏的技术债。
2. 从八十分开始,别从零开始
上一篇文章《受够了 Vibe Coding 的失控?换个起点,让 AI 事半功倍》我详细聊过这个方法论:与其让 AI 从零写 2000 行代码(3 处幻觉 API,改了一下午),不如用你的成熟模块搭好 80% 骨架,AI 只补最后 20% 的胶水代码(零幻觉,30 分钟合并)。
我正在做的 GufaForge 就是这个思路的产品化------扫描你的成熟模块库,根据新项目需求自动装配骨架,生成 AI 可直接执行的装配清单。工具还在完善中,完成后会开源,感兴趣的可以先关注公众号「海滨code」,第一时间通知。
3. 建立框架无关的工程纪律
不管你最终选 Hermes、OpenClaw 还是裸写 Claude Code,这些纪律不因框架而变:
- 规划和执行分离------人做规划,AI 做执行。别把两件事混在一起让 AI 自己发挥
- 控制任务粒度------每轮让 AI 做一件具体的事,别让它无人值守跑半小时
- 超频 commit------每完成一小步就提交,出问题能秒回滚
- 写 spec 不写 prompt------与其花时间优化 prompt,不如花时间写清楚 spec.md
这套流程,你用什么框架都适用。框架挂了,流程还在。

所以,Hermes Agent 该不该学
该关注,但没必要急着 all-in。
- Star 它,Watch 它,等 3-6 个月看社区沉淀。 一个月后还有人认真写使用心得的框架,才值得花时间学。一个月后没人提的,现在学了也白学。
- 先把自己的家底理清楚。 你的代码资产、技术栈能力矩阵、AI 能直接复用的模块清单------这些搞不清楚,用什么框架都事倍功半。
- 建立框架无关的工作流。 spec.md → 拆任务 → 喂上下文 → 监督 → commit。这套流程不依赖任何框架,也不会因为哪个框架凉了而作废。
- 如果确实想试 Hermes,用一个小项目试。 别拿你的生产项目当实验场。
GitHub 上有 9,900 个 ai-agent 仓库。最终活下来不会超过 5 个。而你的精力,应该花在那些不随框架消亡的东西上。
"最好的 AI 工具,不是最新的框架,是让 AI 理解你已经有什么。"
关于作者:海滨code,10年+码农,曾任某互联网大厂技术专家。常年专注于原生应用和高性能服务器开发、视频传输和处理技术以及 AI 个人生产力研究。公众号「海滨code」,分享 AI 编程实战和个人技术体系建设。