前言:开源Agent逆袭,Hermes 6:5击败Codex
当Claude Code、Codex等商业AI编程工具炙手可热时,一个MIT协议的开源项目悄悄完成了逆袭。
2026年5月,Hermes Agent 在11项CLI基准测试中以6:5 的比分击败了OpenAI的Codex。这个由Nous Research(Hermes大模型背后的实验室)打造的开源Agent,不仅支持本地部署,更核心的差异化在于------它能自学习,会记住你教给它的技能,越用越聪明。
今天,我们用一块GTX 1660Ti 6GB显卡,实测Hermes Agent + Ollama本地部署效果。不吹不黑,看看开源方案到底能不能打。
一、Hermes Agent是什么
1.1 核心定位
Hermes Agent是一款自进化AI Agent (https://github.com/NousResearch/hermes-agent),GitHub星标已突破**10.1万**,采用MIT完全开源协议。
与常见的聊天机器人或IDE插件不同,Hermes Agent是一个运行在你服务器上的自主智能体:
- 跨会话记忆你的项目、偏好和上下文
- 从经验中自主构建可复用的技能
- 支持15+消息平台(Telegram、Discord、Slack等)
- 运行时间越长,能力越强
1.2 核心特性一览
| 特性 | 说明 |
|---|---|
| 自学习闭环 | 完成复杂任务后自动生成Skill,跨会话复用 |
| 跨会话记忆 | SQLite + FTS5全文检索,记住所有历史上下文 |
| 40+内置工具 | 网页搜索、文件操作、终端命令、代码执行等 |
| 多平台接入 | CLI、Telegram、Discord、Slack、WhatsApp等 |
| 6种运行后端 | 本地、Docker、SSH、Daytona、Singularity、Modal |
| MCP集成 | 可连接任意MCP服务器扩展工具能力 |
| 定时任务 | 内置Cron调度器,支持自动化报告和监控 |
1.3 与Codex方案对比
性能对比:
| 对比项 | Hermes Agent | Codex方案(freedidi.com) |
|---|---|---|
| License | MIT完全开源 | 需OpenAI API |
| 模型支持 | 200+ (任意OpenAI兼容端点) | OpenAI模型为主 |
| 本地部署 | ✅ Ollama/vLLM原生支持 | ✅ Ollama可选 |
| 自学习Skill | ✅ 核心特性,自动创建 | ❌ 无 |
| 跨会话记忆 | ✅ FTS5持久化 | ❌ 每次重置 |
| 硬件需求 | 6GB显卡可跑 | 通常需要更大显存 |
| 价格 | 免费(本地模型) | API按量计费 |
我们的差异化 :freedidi.com的Codex+Ollama方案适合追求云端强模型的用户;而Hermes Agent的核心优势是本地6GB显卡可跑 +自学习Skill机制------这是Codex方案没有的。
二、环境准备:GTX 1660Ti 6GB实战
2.1 我的硬件配置
显卡: GTX 1660Ti 6GB (移动版)
内存: 16GB DDR4
系统: Ubuntu 22.04 (WSL2)
2.2 安装Ollama
Ollama是对话式模型本地运行的核心工具,支持一键拉取和运行各种开源大模型:
bash
# Linux/macOS安装
curl -fsSL https://ollama.com/install.sh | sh
# Windows用户请使用WSL2或在官网下载客户端
# 官网: https://ollama.com/download
2.3 推荐模型选择(6GB显卡友好)
根据社区实测,以下模型在6GB显卡上可以流畅运行:
| 模型 | 参数量 | 显存需求 | 推荐理由 |
|---|---|---|---|
| qwen2.5:7b | 7B | ~4-5GB | 性价比最高,中文能力出色 |
| mistral:7b | 7B | ~4-5GB | 推理能力强,代码表现稳定 |
| llama3:8b | 8B | ~5-6GB | Meta官方,生态成熟 |
| codellama:7b | 7B | ~4-5GB | 专注文档string生成 |
⚠️ 踩坑提醒 :6GB显卡建议使用Q4_K_M量化版本,全精度模型会爆显存。
bash
# 推荐:拉取7B量化模型(6GB显卡最优选择)
ollama pull qwen2.5:7b
ollama pull mistral:7b
# 启动Ollama服务(默认端口11434)
ollama serve
# 验证模型列表
ollama list
2.4 安装Hermes Agent
一行命令完成安装:
bash
# Linux/macOS/WSL2
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
# 安装完成后重载shell
source ~/.bashrc # 或 source ~/.zshrc
# 验证安装
hermes --version
三、配置Hermes接入Ollama
3.1 交互式配置
bash
hermes setup
向导会提示:
- 选择
Quick setup(推荐) - 选择模型提供商 → 选
Custom endpoint - 输入API地址 →
http://localhost:11434/v1 - API Key留空(Ollama无需Key)
- 自动检测已安装的模型
3.2 手动配置(备选方案)
如果交互式配置有问题,可以直接编辑配置文件:
bash
# 编辑配置
hermes config set model.provider custom
hermes config set model.base_url http://localhost:11434/v1
hermes config set model.name qwen2.5:7b
hermes config set model.context_length 8192
3.3 ⚠️ 踩坑记录
问题1:Ollama连接被拒绝
Error: Connection refused to http://localhost:11434
解决:确保Ollama服务已启动
bash
ollama serve # 新开一个终端窗口运行
问题2:模型推理速度极慢
原因 :6GB显卡跑7B模型可能触及显存上限
解决:
- 关闭其他占用显存的程序
- 使用更小的量化模型:
ollama pull qwen2.5:7b-q4_K_M - 降低上下文长度
问题3:Hermes响应超时
解决 :编辑~/.hermes/.env,增加超时时间
HERMES_STREAM_READ_TIMEOUT=1800
四、实测场景:让它帮我干活
4.1 启动Hermes
bash
hermes
终端界面启动成功后会显示:
[Hermes Agent v0.15.1]
> Hello! I'm Hermes, your self-improving AI agent.
> I learn from every interaction and get better over time.
4.2 场景一:自动修复Bug
任务:修复一个Python项目的循环引用问题
> 这个Python文件有循环引用问题,能帮我看看吗?
文件路径: ./src/models/user.py
实际表现:
- ✅ 成功读取文件内容
- ✅ 识别出
User -> Profile -> User的循环依赖 - ✅ 给出具体修改方案(使用
TYPE_CHECKING或前向声明) - ⚠️ 生成完整修复代码时需要多次确认
耗时:约45秒(6GB显卡本地推理)
4.3 场景二:代码重构
任务:将一个200行的函数拆分成多个小函数
> 这个函数太长了,帮我重构一下,保持接口不变
文件: ./src/utils/helper.py
实际表现:
- ✅ 正确理解函数逻辑
- ✅ 合理拆分出4个子函数
- ✅ 保留原函数作为wrapper
- ⚠️ 重构后的命名风格需要手动微调
4.4 场景三:Git自动化
任务:生成commit信息并提交
> 帮我提交这次修改,commit信息要清晰规范
实际表现:
- ✅ 自动执行
git diff - ✅ 分析变更内容
- ✅ 生成符合Conventional Commits规范的commit信息
- ✅ 执行
git add .和git commit
五、核心差异:Skill自学习机制
这是Hermes Agent区别于其他Agent的核心能力。
5.1 什么是Skill
Skill是Hermes从经验中自动生成的程序性记忆。当Agent完成一个复杂的多步骤任务后,它会:
- 分析任务执行轨迹
- 提取可复用的步骤流程
- 保存为
.md格式的Skill文件 - 下次遇到类似任务时自动调用
5.2 Skill存放位置
bash
~/.hermes/skills/ # 用户创建的Skill
~/.hermes/skills/built-in/ # 内置70+ Skill
5.3 查看已有Skill
/skills
内置Skill包括:
git-commit- 智能生成commit信息code-review- 代码审查debug-error- Bug定位与修复read-file- 文件内容分析search-web- 网络搜索- 等等...
5.4 自学习流程演示
bash
# 第一次执行复杂任务
> 帮我分析这个项目的架构,输出一份README文档
# Hermes执行后,会询问是否创建Skill
[Hermes] 检测到这是一个复杂任务序列
[Hermes] 是否将本次操作保存为Skill? (y/n): y
[Hermes] 请命名这个Skill: analyze-project-architecture
# Skill创建成功
[Hermes] Skill "analyze-project-architecture" 已保存至 ~/.hermes/skills/
# 下次使用时
> /analyze-project-architecture
[Hermes] 调用Skill: analyze-project-architecture
5.5 Skill的进化
根据社区反馈,Skill系统具有自我改进特性:
- 同一Skill被多次调用后,Agent会分析成功率
- 自动优化Skill的执行步骤
- 社区评测显示,重复任务时间减少40%(来源:TokenMix.ai benchmark)
六、进阶配置:连接消息平台
Hermes支持通过消息平台远程控制,本质上是一个永远在线的AI助手。
6.1 Telegram配置
bash
hermes gateway setup
# 选择Telegram,按提示输入Bot Token
6.2 启动Gateway
bash
hermes gateway start
现在你可以:
- 在Telegram上发送消息给Bot
- 远程让Hermes执行任务
- 收到任务完成通知
七、总结与适合人群
7.1 实测结论
| 维度 | 评分 | 说明 |
|---|---|---|
| 安装便捷性 | ⭐⭐⭐⭐⭐ | 一行命令完成 |
| 6GB显卡友好度 | ⭐⭐⭐⭐ | Q4量化模型流畅运行 |
| 代码理解能力 | ⭐⭐⭐ | 简单任务表现良好,复杂逻辑需人工介入 |
| 自学习能力 | ⭐⭐⭐⭐⭐ | 差异化核心,显著优于同类产品 |
| 记忆持久化 | ⭐⭐⭐⭐⭐ | SQLite存储,重启不丢失 |
| 响应速度 | ⭐⭐⭐ | 本地推理受限于6GB显卡 |
7.2 适合人群
强烈推荐:
- 🎯 有本地部署需求(隐私/离线场景)
- 🎯 追求长期使用的用户(记忆+Skill越用越强)
- 🎯 有编程基础、愿意调试的技术爱好者
慎选:
- ⚠️ 需要最强代码能力的(建议用Claude Code + 云端模型)
- ⚠️ 不愿意折腾配置的新手
- ⚠️ 对响应速度有极致要求的(本地模型延迟较高)
7.3 与freedidi.com Codex方案的选择建议
| 场景 | 推荐方案 |
|---|---|
| 追求最强模型能力 | freedidi.com Codex + 云端API |
| 注重隐私/离线使用 | Hermes + Ollama本地 |
| 预算有限/长期使用 | Hermes + 本地模型 |
| 需要自学习进化 | Hermes(核心差异) |
相关资源
- Hermes Agent GitHub: https://github.com/NousResearch/hermes-agent
- 官方文档: https://hermes-agent.nousresearch.com/docs/
- 本地LLM基准测试: https://github.com/hero5464-dev/local-llm-benchmark
- Ollama官网: https://ollama.com
- agentskills.io Skill市场: https://agentskills.io/
相关阅读:
本文实测环境:GTX 1660Ti 6GB + 16GB内存 + Ubuntu 22.04 (WSL2)
测评日期:2026年5月29日
Hermes Agent版本:v0.15.1
如果对你有帮助,欢迎点赞、评论、收藏!
