AI-agent工程化(开源git分享)

AI Agent 工程化分享

今天讲什么

今天不按仓库一个个念。

今天按 5 类能力来讲:

  • 看懂项目
  • 长期记忆和上下文供给
  • 沉淀成功做法,让技能进化
  • 按工程流程做事
  • 更长期的记忆和成长

这次涉及 8 个项目:

  • Graphify
  • OpenViking
  • OpenSpace
  • superpowers
  • gstack
  • compound-engineering-plugin
  • M-flow
  • Hermes Agent

前 6 个是主线。

后 2 个放最后扩展。


先分类

1. 看懂项目

(更有助于降低 token)

  • Graphify

2. 长期记忆和上下文供给

(更有助于降低 token)

  • OpenViking

3. 沉淀成功做法,让技能进化

(有助于减少重复推理,从而间接降低 token)

  • OpenSpace

4. 按工程流程做事

(主要提升质量和稳定性,不是直接降 token)

  • superpowers
  • gstack
  • compound-engineering-plugin

5. 扩展方向

(视实现方式而定,不作为直接降 token 主线)

  • M-flow
  • Hermes Agent

一句话总览

工具 一句话
Graphify 把多模态资料变成持久可查询知识图谱
OpenViking 用文件系统范式管理长期记忆和上下文
OpenSpace 把成功路径变成会进化的技能
superpowers 一套会自动触发的工程开发工作流
gstack 把 Claude Code 组织成虚拟工程团队
compound-engineering-plugin 用复利式工作流沉淀团队知识
M-flow 用图推理做检索,而不是只比相似度
Hermes Agent 一个内置学习闭环的自我改进 Agent

1. Graphify

项目地址

一句话:

把代码、文档、PDF、图片等资料转成持久可查询知识图谱。

解决什么问题:

  • 项目太大,看不懂
  • 代码、文档、图片、论文是散的
  • Agent 每次都要重读很多上下文
  • 跨会话还得重新理解项目结构

为什么值得看:

  • 它是面向 Claude Code 的 skill,不只是离线分析工具
  • 图谱会持久化,下次不用重读原始资料
  • 多模态资料可以放进一个统一图里
  • 对大仓库和混合资料源很有价值

我会怎么讲:

Graphify 先解决"理解项目"这件事。


2. OpenViking

项目地址

一句话:

它是给 AI Agent 用的上下文数据库。

解决什么问题:

  • 记忆、资源、技能分散
  • 检索过程太黑盒
  • 上下文一股脑塞给 Agent,成本高
  • 传统 RAG 只有扁平召回,没有全局结构
  • 长期任务里的经验和偏好很难沉淀成可复用记忆

为什么值得看:

  • 用"文件系统范式"统一管理 memory、resources、skills
  • 可以分层加载内容
  • 支持目录递归检索和可视化检索轨迹
  • 会话结束后还能继续提取长期记忆
  • 更适合长期项目

我会怎么讲:

OpenViking 更像"长期记忆系统 + 上下文供给系统"的结合体。


3. OpenSpace

项目地址

一句话:

它更强调把成功做法沉淀成会进化的技能。

解决什么问题:

  • 这次做对了,下次还得重新做
  • 经验留在聊天记录里
  • SOP 没法被 Agent 复用
  • 技能不会随着使用自动变强

为什么值得看:

  • 能沉淀成功路径
  • 适合高频重复任务
  • 用得越久,越贴近团队做法
  • 它的核心是 skill evolution,不是单纯存上下文

我会怎么讲:

OpenSpace 重点不是"记内容",而是"记做法"。


4. superpowers

项目地址

一句话:

它是一套基于 skills 的完整软件开发工作流。

解决什么问题:

  • AI 上来就写
  • 没先规划
  • 没拆计划
  • 没做验证
  • 复杂任务容易偏离计划

为什么值得看:

  • 技能会自动触发,不靠你每次手动提醒
  • 强调 brainstorming、plan、subagent execution、TDD
  • 对中大型任务特别有用

我会怎么讲:

superpowers 不是给 Agent 多加几个命令,而是给它一整套开发流程。


5. gstack

项目地址

一句话:

它把 Claude Code 组织成一个多角色虚拟工程团队。

解决什么问题:

  • 任务不只是写代码
  • 还需要评审、QA、安全、发布
  • 单一 Agent 视角不够
  • 个人开发缺少团队式分工和节奏

为什么值得看:

  • 把产品、设计、工程、QA、安全、发布这些角色补进来
  • 它本质上是一个 sprint 流程:Think -> Plan -> Build -> Review -> Test -> Ship -> Reflect
  • 适合复杂交付链路
  • 单人 + AI 也能更像团队协作

我会怎么讲:

gstack 的重点不是命令多,而是把"一个人干活"补成"像一个团队在交付"。


6. compound-engineering-plugin

项目地址

一句话:

每次开发,不只交付结果,还要把经验沉淀回系统。

解决什么问题:

  • 做完就散
  • 坑没有沉淀
  • 经验没有写回系统
  • 下次还得重新推理
  • 团队知识不能稳定复用

为什么值得看:

  • 官方主线就是 Brainstorm -> Plan -> Work -> Review -> Compound -> Repeat
  • 不只是执行,还强调 review 和 compound
  • 有很多面向 review、research、history 的 agents 和 skills
  • 很适合团队长期复利

我会怎么讲:

compound engineering 的核心,不是多做一次 review,而是把这次学到的东西写回未来。


主线收束

前 6 个工具放在一起,其实很顺:

第一步

先看懂项目:

  • Graphify

第二步

再把长期记忆和上下文供给管起来:

  • OpenViking

第三步

再把成功做法沉淀成技能:

  • OpenSpace

第四步

再把工程流程补齐:

  • superpowers
  • gstack
  • compound-engineering-plugin

最后就能收成一句话:

成功路径 -> 可复用技能 -> 下次少重复推理。


扩展 1:M-flow

项目地址

一句话:

它更像一个让 Agent 更会"找对记忆"的系统。

可以怎么理解:

  • 它不是重点解决"记住"
  • 它更重点解决"怎么从记忆里找对答案"
  • 它会把信息组织成图,再沿关系链和证据链去检索
  • 不是只看关键词像不像,也不是只看向量相似度

我会怎么带:

如果说 OpenViking 更像在管长期记忆和上下文,M-flow 更像在解决"这些记忆怎么被更聪明地找出来"。


扩展 2:Hermes Agent

项目地址

一句话:

它是一个内置学习闭环的自我改进 Agent。

可以怎么理解:

  • 长期记忆
  • 用户偏好积累
  • 技能沉淀
  • 越用越懂你
  • 会从经验里创建和改进 skills

我会怎么带:

Hermes Agent 代表"Agent 不只是完成任务,还会在使用中持续学习"这条路线。

Claw Code 对比:

  • Claw Code 更像公开版的 claw CLI agent harness,重点是 CLI、会话、工具调用、权限控制和 agent runtime
  • Hermes Agent 更像一个长期运行、会学习、会沉淀 skills 和用户画像的通用 agent
  • Claw Code 更偏"把 agent 跑起来的底层框架"
  • Hermes Agent 更偏"在此基础上继续往长期记忆、自我改进、通用助手方向演进"

一句话对比:

Claw Code 更像"会干活的框架",Hermes Agent 更像"会成长的助手"。


最后一句

这些工具不是在做同一件小功能。

它们是在补齐 AI Coding 的基础设施:

  • 有的负责看懂项目
  • 有的负责管理长期记忆和上下文
  • 有的负责让 Agent 按工程流程做事
  • 有的在探索更长期的成长能力

所以今天这场分享,真正的主线是:

让 Agent 从"单次回答",走向"长期复用成功经验"。

相关推荐
code_li2 小时前
淘宝动效全链路解决方案:一次制作多端复用
网络·人工智能·电商·淘宝技术
Yao.Li2 小时前
PVN3D Full ONNX 导出与自定义算子说明
人工智能·3d·具身智能
新缸中之脑2 小时前
Magika:文件类型检测小模型
人工智能
渣渣xiong2 小时前
从零开始:前端转型AI agent直到就业第十二天-第十三天
前端·人工智能
齐齐大魔王2 小时前
机器学习(一)
人工智能·机器学习
笑虾2 小时前
Git 学习笔记 - 合并
git
云和数据.ChenGuang2 小时前
机器学习之方差和标准差计算
人工智能·python·机器学习·django·pygame·deepseek
北京耐用通信2 小时前
破局工业通讯壁垒!耐达讯自动化EtherCAT转RS232网关,老设备焕新核心桥梁
服务器·网络·人工智能·科技·物联网·网络协议·自动化
永霖光电_UVLED2 小时前
AIXTRON(爱思强)于2026年的业务指引实现上调
大数据·人工智能