和AI一起搞事情#7. 给游戏NPC接入Hermes？

上一周一直在搞图片拆PSD图层、海报文字编辑的功能，有一阵没做游戏了，咱接着回来做中医游戏。好了不废话，这期咱们聊聊怎么给游戏NPC装个"智能大脑"，顺便看看开发过程中Hook这个老朋友的新玩法。

先汇报一下进度

✅ 对话卷轴+Hermes：青木先生现在能查病案、翻背包、看进度，还会按教学大纲给你上课，触发辩证游戏，再给你的辩证打分

✅ 炮制游戏：当归 + 黄酒炮制 -> 酒制当归

✅ 病案集：不想跟NPC聊天？行，自己选病例玩辩证游戏

✅ 后端DataBase：前后端增加了数据库进行状态管理，这样可以保证npc工具查询和前端展示数据的一致性。

为什么NPC需要"智能大脑"？

虽然咱没怎么玩过游戏吧，但是也能看过游戏视频呀！那种一碰npc就只会跟你说"向东走那里有意想不到的收获。""是一件很无聊的事情。所以我们希望NPC有自己的灵魂，同时也能根据游戏状态动态变化，最好能直接操控游戏给玩家发布任务。

Agent选型：Python才是真爱

最后选了Hermes而不是Lobster（龙虾🦞），理由简单------我熟Python。

别笑,这事儿很严肃。AI确实降低了跨语言开发门槛，但就像用翻译软件能看懂法语菜单、不代表你能跟法国大厨讨论烹饪技巧。遇到复杂问题时，母语开发效率能差3-5倍，心理压力也完全不同。

所以有些python的开源项目，真的是赢在会python的人太多了...

接入方案：从gateway接入简单快速

核心思路：把游戏当成一个聊天平台，通过Gateway接入Hermes。

Hermes是个三明治架构🥪：

复制代码

┌──────────────────────────────────────────────┐
│            顶层：平台适配器层                  │
│  Telegram | Discord | Slack | WhatsApp | ...  │
│  （翻译官：把各平台事件转为统一格式）            │
└──────────────────┬───────────────────────────┘
                   ↓
┌──────────────────────────────────────────────┐
│           中间层：Gateway 核心               │
│  会话路由 | 授权鉴权 | 限流 | 定时任务        │
│  流式传输 | 媒体处理 | 审批按钮 | Hooks       │
└──────────────────┬───────────────────────────┘
                   ↓
┌──────────────────────────────────────────────┐
│           底层：AIAgent 核心                 │
│  LLM 调用 | 工具调用 | 记忆 | 会话历史        │
│  （对平台一无所知，只管思考和回答）             │
└──────────────────────────────────────────────┘

三层架构的设计，提供了可以灵活接入各个平台的Gateway层，在游戏中灵活的接入Agent的能力，只需要把游戏当做一个平台，提供对应的适配器，来处理流式消息即可。

给NPC装外挂：技能+工具

同时为了让NPC更智能，还需要为每个智能体提供外挂，包括技能、工具、每个智能体的角色文件。

技能层主要是npc的日常SOP工作流，包含以下

而工具层会更复杂一点，因为需要完成所有游戏状态的获取和更新、触发操作，包括

状态获取：获取玩家的背包、病案进度、整体学习进度
状态更新：创建学习任务、触发诊断配伍游戏、记录更新记忆（这里没有完全使用hermes内置的记忆模块，因为非结构化记忆在教学场景的稳定度不满足要求）

工具现在还很基础，更多问题其实需要真实开始场景模拟后暴露出来再进行修复了，不过数据库已经初步接入进来，后续的调整也会更多在数据SCHEMA层所以复杂度还好。主要是记忆和任务模块的边界我还没太想好，走一步看一步吧~

Hook的花样玩法

很多人觉得Hook就是"到点执行固定脚本"------比如任务完成发个通知、调用工具前检查权限。但我觉得Hook的本质是：在AI自主决策的缝隙里，塞入人类的理性。

本质上更像是在LLM自主执行的多个行动之间通过链表的形式穿插进固定的状态和流程。

和/ultrawork的思路互补，一个是自主之中有编排，另一个是编排之中有自主，最终或者会走向统一？

并且毫无意外的是并不引入新的语法，而是就基于coding本身实现编排，毕竟这是AI当前完成最好，最容易校验的任务。

那在游戏的开发中我们用到了哪些hooks呢？

Pre-tool Hook：Key泄露拦截器

血泪教训：某天让AI帮我提交代码,结果它把我的OpenAI Key一起push到GitHub了😱。

赶紧用git-filter-repo把所有历史commit扫了一遍（⚠️ 警告：这玩意会重写Git历史，操作前务必备份！）

于是立刻马上就让CC增加了安全扫描Hook，也是最基础的"脚本型"Hook，具体的指令流程如下。

Hook的开发其实可以类比接入新API，先去官网拉取Hook开发规范并写入文档，这样之后开发新的hooks也不需要在查规范直接先看文档就完了，之后再开始开发hook，并E2E测试后再接入。

最搞笑的地方来了....

因为安全拦截做的太强，导致写好的hook代码本身无法commit了....

然后AI看到拦截消息，回复"我太强了"

哈哈哈哈，笑不活了.....

Post-Tool Hook：设计文档审查官

问题：让AI设计功能时，它经常被用户的提问"带偏"。

比如我说"背包数据显示不一致"，AI只会修修补补解决表面问题，而不会意识到根因是缺少统一的状态管理数据库。

解决方案：加个"事后诸葛亮"的反思Hook

当检测到工具输出是对docs/superpowers/specs进行文件写入时，当自动触发审核任务。

这个Hook更复杂些，是一个"脚本型"hook，因为所有反思，评估都需要在新的上下文中执行。通过脚本启动独立CC进程进行设计文档的审核，从整个设计文档需要解决的问题触发，审核文档是否有遗漏、模糊、矛盾待澄清的设计点。

AI圈其实是个圈，没过一阵就会发现历史的风又吹风回来了。所以自主虽好，但self-evaluation（reflection）在当前的模型能力下依旧有加成的。

这和superpowers自带的spec-review有啥区别?

自带的：细节微调，像语文老师改错别字, 并且纯靠指令触发，国产模型长上文的触发概率并不高...以至于我看源码前都不知道这个功能竟然存在......
我的Hook：全局审查，像技术总监做Code Review，并且通过hook强制触发

Pre-Compact + Session-Start Hook：记忆交接棒

个人体验CC的compact效果比较一般，也或许不同类型的项目本就需要不同的跨session信息传递方式。

所以还是自己上手做了，好不好另说，至少肯定不会再埋怨别人，只会蛐蛐自己。

选择的方案是在compact之前同时创建"handover.md" + "STATE.md" + "PROGRESS.MD"这三个文件，还是那个思路文件持久化，作为唯一真相源，他们分别存储

STATE：项目状态描述，长期
PROGRESS：当前进行中任务状态描述，短期
handover.md: 简要概括STATE+PROGRESS并引用对应文档，然后给出下一步todo指令

然后再下一个session start的时候通过Prompt hook，在上下文中自动载入handover.md就行了。

所以整个Agent循环总共涉及到了以下Hook的触发流程

如果涉及到多个Agent并发工作，例如teammate模式之类的，注意需要配合git worktree一起使用，不然会出现更新冲突哟。