AI Agent 工程化分享
今天讲什么
今天不按仓库一个个念。
今天按 5 类能力来讲:
- 看懂项目
- 长期记忆和上下文供给
- 沉淀成功做法,让技能进化
- 按工程流程做事
- 更长期的记忆和成长
这次涉及 8 个项目:
GraphifyOpenVikingOpenSpacesuperpowersgstackcompound-engineering-pluginM-flowHermes Agent
前 6 个是主线。
后 2 个放最后扩展。
先分类
1. 看懂项目
(更有助于降低 token)
Graphify
2. 长期记忆和上下文供给
(更有助于降低 token)
OpenViking
3. 沉淀成功做法,让技能进化
(有助于减少重复推理,从而间接降低 token)
OpenSpace
4. 按工程流程做事
(主要提升质量和稳定性,不是直接降 token)
superpowersgstackcompound-engineering-plugin
5. 扩展方向
(视实现方式而定,不作为直接降 token 主线)
M-flowHermes Agent
一句话总览
| 工具 | 一句话 |
|---|---|
Graphify |
把多模态资料变成持久可查询知识图谱 |
OpenViking |
用文件系统范式管理长期记忆和上下文 |
OpenSpace |
把成功路径变成会进化的技能 |
superpowers |
一套会自动触发的工程开发工作流 |
gstack |
把 Claude Code 组织成虚拟工程团队 |
compound-engineering-plugin |
用复利式工作流沉淀团队知识 |
M-flow |
用图推理做检索,而不是只比相似度 |
Hermes Agent |
一个内置学习闭环的自我改进 Agent |
1. Graphify
一句话:
把代码、文档、PDF、图片等资料转成持久可查询知识图谱。
解决什么问题:
- 项目太大,看不懂
- 代码、文档、图片、论文是散的
- Agent 每次都要重读很多上下文
- 跨会话还得重新理解项目结构
为什么值得看:
- 它是面向 Claude Code 的 skill,不只是离线分析工具
- 图谱会持久化,下次不用重读原始资料
- 多模态资料可以放进一个统一图里
- 对大仓库和混合资料源很有价值
我会怎么讲:
Graphify 先解决"理解项目"这件事。
2. OpenViking
一句话:
它是给 AI Agent 用的上下文数据库。
解决什么问题:
- 记忆、资源、技能分散
- 检索过程太黑盒
- 上下文一股脑塞给 Agent,成本高
- 传统 RAG 只有扁平召回,没有全局结构
- 长期任务里的经验和偏好很难沉淀成可复用记忆
为什么值得看:
- 用"文件系统范式"统一管理 memory、resources、skills
- 可以分层加载内容
- 支持目录递归检索和可视化检索轨迹
- 会话结束后还能继续提取长期记忆
- 更适合长期项目
我会怎么讲:
OpenViking 更像"长期记忆系统 + 上下文供给系统"的结合体。
3. OpenSpace
一句话:
它更强调把成功做法沉淀成会进化的技能。
解决什么问题:
- 这次做对了,下次还得重新做
- 经验留在聊天记录里
- SOP 没法被 Agent 复用
- 技能不会随着使用自动变强
为什么值得看:
- 能沉淀成功路径
- 适合高频重复任务
- 用得越久,越贴近团队做法
- 它的核心是
skill evolution,不是单纯存上下文
我会怎么讲:
OpenSpace 重点不是"记内容",而是"记做法"。
4. superpowers
一句话:
它是一套基于 skills 的完整软件开发工作流。
解决什么问题:
- AI 上来就写
- 没先规划
- 没拆计划
- 没做验证
- 复杂任务容易偏离计划
为什么值得看:
- 技能会自动触发,不靠你每次手动提醒
- 强调 brainstorming、plan、subagent execution、TDD
- 对中大型任务特别有用
我会怎么讲:
superpowers 不是给 Agent 多加几个命令,而是给它一整套开发流程。
5. gstack
一句话:
它把 Claude Code 组织成一个多角色虚拟工程团队。
解决什么问题:
- 任务不只是写代码
- 还需要评审、QA、安全、发布
- 单一 Agent 视角不够
- 个人开发缺少团队式分工和节奏
为什么值得看:
- 把产品、设计、工程、QA、安全、发布这些角色补进来
- 它本质上是一个 sprint 流程:Think -> Plan -> Build -> Review -> Test -> Ship -> Reflect
- 适合复杂交付链路
- 单人 + AI 也能更像团队协作
我会怎么讲:
gstack 的重点不是命令多,而是把"一个人干活"补成"像一个团队在交付"。
6. compound-engineering-plugin
一句话:
每次开发,不只交付结果,还要把经验沉淀回系统。
解决什么问题:
- 做完就散
- 坑没有沉淀
- 经验没有写回系统
- 下次还得重新推理
- 团队知识不能稳定复用
为什么值得看:
- 官方主线就是
Brainstorm -> Plan -> Work -> Review -> Compound -> Repeat - 不只是执行,还强调 review 和 compound
- 有很多面向 review、research、history 的 agents 和 skills
- 很适合团队长期复利
我会怎么讲:
compound engineering 的核心,不是多做一次 review,而是把这次学到的东西写回未来。
主线收束
前 6 个工具放在一起,其实很顺:
第一步
先看懂项目:
Graphify
第二步
再把长期记忆和上下文供给管起来:
OpenViking
第三步
再把成功做法沉淀成技能:
OpenSpace
第四步
再把工程流程补齐:
superpowersgstackcompound-engineering-plugin
最后就能收成一句话:
成功路径 -> 可复用技能 -> 下次少重复推理。
扩展 1:M-flow
一句话:
它更像一个让 Agent 更会"找对记忆"的系统。
可以怎么理解:
- 它不是重点解决"记住"
- 它更重点解决"怎么从记忆里找对答案"
- 它会把信息组织成图,再沿关系链和证据链去检索
- 不是只看关键词像不像,也不是只看向量相似度
我会怎么带:
如果说 OpenViking 更像在管长期记忆和上下文,M-flow 更像在解决"这些记忆怎么被更聪明地找出来"。
扩展 2:Hermes Agent
一句话:
它是一个内置学习闭环的自我改进 Agent。
可以怎么理解:
- 长期记忆
- 用户偏好积累
- 技能沉淀
- 越用越懂你
- 会从经验里创建和改进 skills
我会怎么带:
Hermes Agent 代表"Agent 不只是完成任务,还会在使用中持续学习"这条路线。
和 Claw Code 对比:
Claw Code更像公开版的clawCLI agent harness,重点是 CLI、会话、工具调用、权限控制和 agent runtimeHermes Agent更像一个长期运行、会学习、会沉淀 skills 和用户画像的通用 agentClaw Code更偏"把 agent 跑起来的底层框架"Hermes Agent更偏"在此基础上继续往长期记忆、自我改进、通用助手方向演进"
一句话对比:
Claw Code 更像"会干活的框架",Hermes Agent 更像"会成长的助手"。
最后一句
这些工具不是在做同一件小功能。
它们是在补齐 AI Coding 的基础设施:
- 有的负责看懂项目
- 有的负责管理长期记忆和上下文
- 有的负责让 Agent 按工程流程做事
- 有的在探索更长期的成长能力
所以今天这场分享,真正的主线是:
让 Agent 从"单次回答",走向"长期复用成功经验"。