AI-agent工程化（开源git分享）

AI Agent 工程化分享

今天讲什么

今天不按仓库一个个念。

今天按 5 类能力来讲：

看懂项目
长期记忆和上下文供给
沉淀成功做法，让技能进化
按工程流程做事
更长期的记忆和成长

这次涉及 8 个项目：

Graphify
OpenViking
OpenSpace
superpowers
gstack
compound-engineering-plugin
M-flow
Hermes Agent

前 6 个是主线。

后 2 个放最后扩展。

先分类

1. 看懂项目

（更有助于降低 token）

Graphify

2. 长期记忆和上下文供给

（更有助于降低 token）

OpenViking

3. 沉淀成功做法，让技能进化

（有助于减少重复推理，从而间接降低 token）

OpenSpace

4. 按工程流程做事

（主要提升质量和稳定性，不是直接降 token）

superpowers
gstack
compound-engineering-plugin

5. 扩展方向

（视实现方式而定，不作为直接降 token 主线）

M-flow
Hermes Agent

一句话总览

工具	一句话
`Graphify`	把多模态资料变成持久可查询知识图谱
`OpenViking`	用文件系统范式管理长期记忆和上下文
`OpenSpace`	把成功路径变成会进化的技能
`superpowers`	一套会自动触发的工程开发工作流
`gstack`	把 Claude Code 组织成虚拟工程团队
`compound-engineering-plugin`	用复利式工作流沉淀团队知识
`M-flow`	用图推理做检索，而不是只比相似度
`Hermes Agent`	一个内置学习闭环的自我改进 Agent

1. Graphify

项目地址

一句话：

把代码、文档、PDF、图片等资料转成持久可查询知识图谱。

解决什么问题：

项目太大，看不懂
代码、文档、图片、论文是散的
Agent 每次都要重读很多上下文
跨会话还得重新理解项目结构

为什么值得看：

它是面向 Claude Code 的 skill，不只是离线分析工具
图谱会持久化，下次不用重读原始资料
多模态资料可以放进一个统一图里
对大仓库和混合资料源很有价值

我会怎么讲：

Graphify 先解决"理解项目"这件事。

2. OpenViking

项目地址

一句话：

它是给 AI Agent 用的上下文数据库。

解决什么问题：

记忆、资源、技能分散
检索过程太黑盒
上下文一股脑塞给 Agent，成本高
传统 RAG 只有扁平召回，没有全局结构
长期任务里的经验和偏好很难沉淀成可复用记忆

为什么值得看：

用"文件系统范式"统一管理 memory、resources、skills
可以分层加载内容
支持目录递归检索和可视化检索轨迹
会话结束后还能继续提取长期记忆
更适合长期项目

我会怎么讲：

OpenViking 更像"长期记忆系统 + 上下文供给系统"的结合体。

3. OpenSpace

项目地址

一句话：

它更强调把成功做法沉淀成会进化的技能。

解决什么问题：

这次做对了，下次还得重新做
经验留在聊天记录里
SOP 没法被 Agent 复用
技能不会随着使用自动变强

为什么值得看：

能沉淀成功路径
适合高频重复任务
用得越久，越贴近团队做法
它的核心是 skill evolution，不是单纯存上下文

我会怎么讲：

OpenSpace 重点不是"记内容"，而是"记做法"。

4. superpowers

项目地址

一句话：

它是一套基于 skills 的完整软件开发工作流。

解决什么问题：

AI 上来就写
没先规划
没拆计划
没做验证
复杂任务容易偏离计划

为什么值得看：

技能会自动触发，不靠你每次手动提醒
强调 brainstorming、plan、subagent execution、TDD
对中大型任务特别有用

我会怎么讲：

superpowers 不是给 Agent 多加几个命令，而是给它一整套开发流程。

5. gstack

项目地址

一句话：

它把 Claude Code 组织成一个多角色虚拟工程团队。

解决什么问题：

任务不只是写代码
还需要评审、QA、安全、发布
单一 Agent 视角不够
个人开发缺少团队式分工和节奏

为什么值得看：

把产品、设计、工程、QA、安全、发布这些角色补进来
它本质上是一个 sprint 流程：Think -> Plan -> Build -> Review -> Test -> Ship -> Reflect
适合复杂交付链路
单人 + AI 也能更像团队协作

我会怎么讲：

gstack 的重点不是命令多，而是把"一个人干活"补成"像一个团队在交付"。

6. compound-engineering-plugin

项目地址

一句话：

每次开发，不只交付结果，还要把经验沉淀回系统。

解决什么问题：

做完就散
坑没有沉淀
经验没有写回系统
下次还得重新推理
团队知识不能稳定复用

为什么值得看：

官方主线就是 Brainstorm -> Plan -> Work -> Review -> Compound -> Repeat
不只是执行，还强调 review 和 compound
有很多面向 review、research、history 的 agents 和 skills
很适合团队长期复利

我会怎么讲：

compound engineering 的核心，不是多做一次 review，而是把这次学到的东西写回未来。

主线收束

前 6 个工具放在一起，其实很顺：

第一步

先看懂项目：

Graphify

第二步

再把长期记忆和上下文供给管起来：

OpenViking

第三步

再把成功做法沉淀成技能：

OpenSpace

第四步

再把工程流程补齐：

superpowers
gstack
compound-engineering-plugin

最后就能收成一句话：

成功路径 -> 可复用技能 -> 下次少重复推理。

扩展 1：M-flow

项目地址

一句话：

它更像一个让 Agent 更会"找对记忆"的系统。

可以怎么理解：

它不是重点解决"记住"
它更重点解决"怎么从记忆里找对答案"
它会把信息组织成图，再沿关系链和证据链去检索
不是只看关键词像不像，也不是只看向量相似度

我会怎么带：

如果说 OpenViking 更像在管长期记忆和上下文，M-flow 更像在解决"这些记忆怎么被更聪明地找出来"。

扩展 2：Hermes Agent

项目地址

一句话：

它是一个内置学习闭环的自我改进 Agent。

可以怎么理解：

长期记忆
用户偏好积累
技能沉淀
越用越懂你
会从经验里创建和改进 skills

我会怎么带：

Hermes Agent 代表"Agent 不只是完成任务，还会在使用中持续学习"这条路线。

和 Claw Code 对比：

Claw Code 更像公开版的 claw CLI agent harness，重点是 CLI、会话、工具调用、权限控制和 agent runtime
Hermes Agent 更像一个长期运行、会学习、会沉淀 skills 和用户画像的通用 agent
Claw Code 更偏"把 agent 跑起来的底层框架"
Hermes Agent 更偏"在此基础上继续往长期记忆、自我改进、通用助手方向演进"

一句话对比：

Claw Code 更像"会干活的框架"，Hermes Agent 更像"会成长的助手"。

最后一句

这些工具不是在做同一件小功能。

它们是在补齐 AI Coding 的基础设施：

有的负责看懂项目
有的负责管理长期记忆和上下文
有的负责让 Agent 按工程流程做事
有的在探索更长期的成长能力

所以今天这场分享，真正的主线是：

让 Agent 从"单次回答"，走向"长期复用成功经验"。