系列:Hermes Agent 源码探秘 作者:元思未来 字数:约3000字
前面的文章里,Agent 每次启动都是"一张白纸"。它不知道你是谁,不记得上次聊了什么,每次都是全新的开始。
但现实中的助理------不管是人类还是数字的------都需要记忆和学习能力。
Hermes 有两套机制来解决这个问题:
| 机制 | 作用 | 类比人类 |
|---|---|---|
| Memory(记忆) | 记住用户偏好、事实信息 | 长期记忆 |
| Skills(技能) | 学会完成特定任务的流程 | 肌肉记忆/操作规程 |
这篇就来拆这两个系统。
一、记忆系统(Memory)
1.1 记忆解决什么问题?
每次 Agent 会话都是独立的。如果没有记忆:
第一次对话:
你:我喜欢简洁的回答
Agent:好的,记住了!
第二天:
你:帮我查一下资料
Agent:好的!(又变成啰嗦模式了)
------它忘了你的偏好
有了记忆,Agent 就能跨会话记住信息:
arduino
第一次对话:
你:我喜欢简洁的回答
记忆:存储在数据库中
第二天:
你:帮我查一下资料
Agent:加载记忆 → "用户喜欢简洁" → 简洁回答
1.2 记忆系统的架构
记忆系统的实现在 agent/memory_manager.py:
python
class MemoryManager:
def __init__(self, provider):
self.provider = provider # 存储后端
def get_relevant_memories(self, query, limit=5):
"""根据当前对话获取相关记忆"""
return self.provider.search(query, limit)
def save_memory(self, content, metadata=None):
"""保存新记忆"""
return self.provider.save(content, metadata)
def update_memory(self, memory_id, content):
"""更新已有记忆"""
return self.provider.update(memory_id, content)
它不自己存储数据,而是委托给存储提供者(provider)。支持多种后端:
python
# 不同存储后端
class BuiltinMemoryProvider:
"""使用本地 SQLite 存储(默认)"""
def search(self, query, limit):
# 简单的关键词匹配
...
def save(self, content, metadata):
# 写入 SQLite
...
class HonchoMemoryProvider:
"""使用 Honcho(一个专门的记忆服务)"""
def search(self, query, limit):
# 向量相似度搜索
...
class Mem0MemoryProvider:
"""使用 Mem0 记忆服务"""
def search(self, query, limit):
# Mem0 的语义搜索
...
1.3 记忆在对话中的注入流程
当用户发起对话时,记忆系统的执行流程:
python
用户发消息
│
▼
build_memory_context_block()
│ 从记忆库中搜索与当前话题相关的记忆
│ 比如用户问"帮我写个Python脚本"
│ 记忆:用户是Python开发者,喜欢Type hints
▼
搜索到的记忆注入到 System Prompt
│
▼
Agent 看到记忆 → 据此调整回答风格
关键代码在 agent/memory_manager.py 的 build_memory_context_block():
python
def build_memory_context_block(memory_manager, user_message, user_profile=None):
context_parts = []
# 1. 加载用户画像(偏好、风格等)
if user_profile:
context_parts.append(f"## 用户信息\n{user_profile}")
# 2. 搜索相关记忆
memories = memory_manager.get_relevant_memories(user_message)
if memories:
memory_text = "\n".join([f"- {m.content}" for m in memories])
context_parts.append(f"## 相关记忆\n{memory_text}")
return "\n\n".join(context_parts)
注入后的 System Prompt 看起来像这样:
diff
...
【用户信息】
用户是全栈开发者,擅长Python和JavaScript
喜欢简洁的回答风格
偏好FastAPI而非Flask
【相关记忆】
- 用户之前在做一个炒股小工具
- 用户对AI Agent源码感兴趣,在写一个拆解系列
...
1.4 记忆的保存时机
记忆不会自动保存每一句话------那样会存太多噪声。Hermes 在特定的时机保存记忆:
- 用户主动要求 :"记住我喜欢简洁的回答" →
memory_tool工具被调用 - Agent 判断有价值的信息:在对话结束时,Agent 会自动总结有价值的记忆点
- 明确的偏好更正:当用户纠正 Agent 的行为时
memory_tool 的实现:
python
# tools/memory_tool.py
def save_memory(content: str, target: str = "memory", task_id: str = None) -> str:
"""保存一段记忆到持久存储"""
memory_manager.save(
content=content,
metadata={
"target": target, # "memory" 或 "user"
"timestamp": time.time(),
"source": "user_request"
}
)
return json.dumps({"status": "saved"})
二、技能系统(Skills)
如果说记忆是"记住事实",那技能就是"学会做事"。
2.1 什么是"技能"?
技能是一个 Markdown 文件,描述如何完成某个特定任务:
objectivec
~/.hermes/skills/
├── writing-plans/
│ └── SKILL.md ← 技能文件
├── test-driven-development/
│ └── SKILL.md
├── systematic-debugging/
│ └── SKILL.md
└── ...
每个技能的核心文件是 SKILL.md,包含两部分:
- YAML 前置元数据(frontmatter)
- Markdown 正文(指令内容)
2.2 技能文件结构
markdown
---
name: test-driven-development
description: TDD 工作流:先写测试,再写代码,然后重构
version: 1.0.0
---
# TDD 工作流
当你需要实现一个新功能时,按以下步骤执行:
## Step 1:写测试(RED)
- 先写一个会失败的测试用例
- 明确输入和期望输出
- 运行测试,确认是红色(失败)
## Step 2:写实现(GREEN)
- 写刚好能让测试通过的代码
- 不要过度设计
- 运行测试,确认是绿色(通过)
## Step 3:重构(REFACTOR)
- 在测试保护下优化代码
- 提高可读性和性能
- 确保测试仍然通过
## 注意事项
- ❌ 不要跳过测试先写实现
- ❌ 不要一次写太多代码
- ✅ 每次只做一个功能点
2.3 技能的加载流程
python
# agent/skill_utils.py
def get_all_skills_dirs():
"""扫描所有技能目录"""
skills_dir = get_skills_dir()
return [d for d in skills_dir.iterdir() if d.is_dir()]
def load_skill(skill_dir):
"""加载一个技能"""
skill_file = skill_dir / "SKILL.md"
if not skill_file.exists():
return None
with open(skill_file, "r") as f:
content = f.read()
# 解析 frontmatter 和正文
frontmatter, body = parse_frontmatter(content)
return {
"name": frontmatter.get("name", skill_dir.name),
"description": frontmatter.get("description", ""),
"content": body,
"path": skill_dir
}
2.4 技能注入 System Prompt
当 Agent 加载了一个技能,这个技能的内容就会被注入到 System Prompt 中:
python
# agent/system_prompt.py
def build_skills_section(enabled_skills):
"""构建技能部分的 system prompt"""
parts = []
for skill_name in enabled_skills:
skill = load_skill(skill_name)
if skill:
parts.append(f"""
## 技能:{skill['name']}
{skill['description']}
{skill['content']}
""")
if parts:
return "以下是你需要遵循的技能指南:\n" + "\n---\n".join(parts)
return ""
所以"教 Agent 新技能"本质上就是往 System Prompt 里塞了一段 Markdown 文本。 LLM 看到了这段指令,就会按照其中的步骤执行任务。
2.5 技能的生命周期管理
Hermes 还有个 Curator(策展人) 系统,自动管理技能的整个生命周期:
bash
hermes curator status # 查看技能状态
hermes curator run # 手动执行一次维护
hermes curator pin name # 固定技能(不被自动清理)
hermes curator unpin name # 解锁
Curator 会:
- 跟踪技能使用频率:不常用的技能标记为"空闲"
- 自动归档:长时间不用的技能自动归档
- 备份:定期打包备份所有技能,防止丢失
python
# agent/curator.py
class Curator:
def __init__(self, skills_dir):
self.skills_dir = skills_dir
self.usage_db = UsageTracker() # SQLite 记录使用情况
def run_maintenance(self):
"""执行维护任务"""
for skill in self._get_all_skills():
stats = self.usage_db.get_stats(skill.name)
# 判断技能是否应该归档
if stats.is_idle():
self._archive_skill(skill)
# 判断技能是否应该标记为过期
if stats.is_stale():
self._mark_stale(skill)
def _archive_skill(self, skill):
"""将技能移入归档目录"""
shutil.move(skill.path, ARCHIVE_DIR / skill.name)
self.usage_db.set_state(skill.name, "archived")
三、记忆 vs 技能:对比与协同
| 维度 | 记忆(Memory) | 技能(Skills) |
|---|---|---|
| 存储内容 | 事实、偏好、用户信息 | 操作流程、步骤、规范 |
| 存储格式 | 键值对/向量 | Markdown 文件 |
| 检索方式 | 语义搜索(相关度) | 精确匹配(按名称加载) |
| 生命周期 | 永久保存 | 由 Curator 管理 |
| 修改方式 | memory_tool 工具 |
直接编辑 SKILL.md |
| 适用场景 | "用户喜欢什么" | "怎么完成某任务" |
它们怎么协同工作?
sql
用户说:"写个Python脚本处理CSV"
1. Memory 系统介入:
→ 搜索记忆 → "用户是Python开发者"
→ 搜索记忆 → "用户之前做过类似的数据处理"
→ 注入到 System Prompt
2. 如果已加载 "python-best-practices" 技能:
→ 技能内容注入到 System Prompt
→ "使用类型注解、写docstring、用pathlib"
3. Agent 开始工作
→ "用户是Python开发者" → 代码风格符合
→ "有最佳实践技能" → 结构规范
→ 输出质量更高
记忆提供了"上下文",技能提供了"能力"。两者结合,Agent 才能越来越懂你、越来越能干。
四、这个设计好在哪里?
1. 记忆即插即用
多种存储后端可选(内置 SQLite、Honcho、Mem0),从小项目到大规模都可以。
2. 技能即文档
用 Markdown 教 Agent 做事。门槛极低------写文档就是在训练 AI。
3. 自动化的生命周期管理
Curator 自动管理技能的"生老病死",不用手动清理。
4. 零代码扩展
添加记忆不需要改代码,添加技能只需要创建 Markdown 文件。这让非技术人员也能参与 Agent 的"训练"。
五、下一篇预告
Agent 有手(工具系统),有脑(核心循环),有记忆(Memory & Skills),还能服务多平台(Gateway)。但有时候,一个 Agent 不够用怎么办?
一个复杂的任务需要多个人协作完成。
第八篇我们拆 子代理系统(Delegation) --- "Agent 生 Agent"的机制。看一个 Hermes 怎么派出多个"子 Hermes"并行干活,然后把结果汇总回来。
代码位置:
~/.hermes/hermes-agent/agent/memory_manager.py
技能目录:~/.hermes/skills/
关键主题: 记忆存储、技能注入、Curator 自动化管理
元思未来 · 行稳致远,进而有为