和AI一起搞事情#7. 给游戏NPC接入Hermes?

上一周一直在搞图片拆PSD图层、海报文字编辑的功能,有一阵没做游戏了,咱接着回来做中医游戏。好了不废话,这期咱们聊聊怎么给游戏NPC装个"智能大脑",顺便看看开发过程中Hook这个老朋友的新玩法。

先汇报一下进度

✅ 对话卷轴+Hermes:青木先生现在能查病案、翻背包、看进度,还会按教学大纲给你上课,触发辩证游戏,再给你的辩证打分

✅ 炮制游戏:当归 + 黄酒炮制 -> 酒制当归

✅ 病案集:不想跟NPC聊天?行,自己选病例玩辩证游戏

✅ 后端DataBase:前后端增加了数据库进行状态管理,这样可以保证npc工具查询和前端展示数据的一致性。

为什么NPC需要"智能大脑"?

虽然咱没怎么玩过游戏吧,但是也能看过游戏视频呀!那种一碰npc就只会跟你说"向东走那里有意想不到的收获。""是一件很无聊的事情。所以我们希望NPC有自己的灵魂,同时也能根据游戏状态动态变化,最好能直接操控游戏给玩家发布任务。

Agent选型:Python才是真爱

最后选了Hermes而不是Lobster(龙虾🦞),理由简单------我熟Python。

别笑,这事儿很严肃。AI确实降低了跨语言开发门槛,但就像用翻译软件能看懂法语菜单、不代表你能跟法国大厨讨论烹饪技巧。遇到复杂问题时,母语开发效率能差3-5倍,心理压力也完全不同。

所以有些python的开源项目,真的是赢在会python的人太多了...

接入方案:从gateway接入简单快速

核心思路:把游戏当成一个聊天平台,通过Gateway接入Hermes。

Hermes是个三明治架构🥪:

复制代码
┌──────────────────────────────────────────────┐
│            顶层:平台适配器层                  │
│  Telegram | Discord | Slack | WhatsApp | ...  │
│  (翻译官:把各平台事件转为统一格式)            │
└──────────────────┬───────────────────────────┘
                   ↓
┌──────────────────────────────────────────────┐
│           中间层:Gateway 核心               │
│  会话路由 | 授权鉴权 | 限流 | 定时任务        │
│  流式传输 | 媒体处理 | 审批按钮 | Hooks       │
└──────────────────┬───────────────────────────┘
                   ↓
┌──────────────────────────────────────────────┐
│           底层:AIAgent 核心                 │
│  LLM 调用 | 工具调用 | 记忆 | 会话历史        │
│  (对平台一无所知,只管思考和回答)             │
└──────────────────────────────────────────────┘

三层架构的设计,提供了可以灵活接入各个平台的Gateway层,在游戏中灵活的接入Agent的能力,只需要把游戏当做一个平台,提供对应的适配器,来处理流式消息即可。

给NPC装外挂:技能+工具

同时为了让NPC更智能,还需要为每个智能体提供外挂,包括技能、工具、每个智能体的角色文件

技能层主要是npc的日常SOP工作流,包含以下

而工具层会更复杂一点,因为需要完成所有游戏状态的获取和更新、触发操作,包括

  • 状态获取:获取玩家的背包、病案进度、整体学习进度
  • 状态更新:创建学习任务、触发诊断配伍游戏、记录更新记忆(这里没有完全使用hermes内置的记忆模块,因为非结构化记忆在教学场景的稳定度不满足要求)

工具现在还很基础,更多问题其实需要真实开始场景模拟后暴露出来再进行修复了,不过数据库已经初步接入进来,后续的调整也会更多在数据SCHEMA层所以复杂度还好。主要是记忆和任务模块的边界我还没太想好,走一步看一步吧~

Hook的花样玩法

很多人觉得Hook就是"到点执行固定脚本"------比如任务完成发个通知、调用工具前检查权限。但我觉得Hook的本质是:在AI自主决策的缝隙里,塞入人类的理性。

本质上更像是在LLM自主执行的多个行动之间通过链表的形式穿插进固定的状态和流程。

和/ultrawork的思路互补,一个是自主之中有编排,另一个是编排之中有自主,最终或者会走向统一?

并且毫无意外的是并不引入新的语法,而是就基于coding本身实现编排,毕竟这是AI当前完成最好,最容易校验的任务。

那在游戏的开发中我们用到了哪些hooks呢?

Pre-tool Hook:Key泄露拦截器

血泪教训:某天让AI帮我提交代码,结果它把我的OpenAI Key一起push到GitHub了😱。

赶紧用git-filter-repo把所有历史commit扫了一遍(⚠️ 警告:这玩意会重写Git历史,操作前务必备份!)

于是立刻马上就让CC增加了安全扫描Hook,也是最基础的"脚本型"Hook,具体的指令流程如下。

Hook的开发其实可以类比接入新API,先去官网拉取Hook开发规范并写入文档,这样之后开发新的hooks也不需要在查规范直接先看文档就完了,之后再开始开发hook,并E2E测试后再接入。

最搞笑的地方来了....

因为安全拦截做的太强,导致写好的hook代码本身无法commit了....

然后AI看到拦截消息,回复"我太强了"

哈哈哈哈,笑不活了.....

Post-Tool Hook:设计文档审查官

问题:让AI设计功能时,它经常被用户的提问"带偏"。

比如我说"背包数据显示不一致",AI只会修修补补解决表面问题,而不会意识到根因是缺少统一的状态管理数据库。

解决方案:加个"事后诸葛亮"的反思Hook

当检测到工具输出是对docs/superpowers/specs进行文件写入时,当自动触发审核任务。

这个Hook更复杂些,是一个"脚本型"hook,因为所有反思评估都需要在新的上下文中执行。通过脚本启动独立CC进程进行设计文档的审核,从整个设计文档需要解决的问题触发,审核文档是否有遗漏、模糊、矛盾待澄清的设计点。

AI圈其实是个圈,没过一阵就会发现历史的风又吹风回来了。所以自主虽好,但self-evaluation(reflection)在当前的模型能力下依旧有加成的。

这和superpowers自带的spec-review有啥区别?

  • 自带的:细节微调,像语文老师改错别字, 并且纯靠指令触发,国产模型长上文的触发概率并不高...以至于我看源码前都不知道这个功能竟然存在......
  • 我的Hook:全局审查,像技术总监做Code Review,并且通过hook强制触发

Pre-Compact + Session-Start Hook:记忆交接棒

个人体验CC的compact效果比较一般,也或许不同类型的项目本就需要不同的跨session信息传递方式。

所以还是自己上手做了,好不好另说,至少肯定不会再埋怨别人,只会蛐蛐自己。

选择的方案是在compact之前同时创建"handover.md" + "STATE.md" + "PROGRESS.MD"这三个文件,还是那个思路文件持久化,作为唯一真相源,他们分别存储

  • STATE:项目状态描述,长期
  • PROGRESS:当前进行中任务状态描述,短期
  • handover.md: 简要概括STATE+PROGRESS并引用对应文档,然后给出下一步todo指令

然后再下一个session start的时候通过Prompt hook,在上下文中自动载入handover.md就行了。

所以整个Agent循环总共涉及到了以下Hook的触发流程

如果涉及到多个Agent并发工作,例如teammate模式之类的,注意需要配合git worktree一起使用,不然会出现更新冲突哟。

相关推荐
xinshuGEO14 小时前
企业做 AI 搜索优化时,Prompt 问题池应该怎么设计?一种智能体系统实现思路
人工智能·prompt
倔强的初学者17 小时前
呼入智能客服提示词工程实战:从方法选型到框架融合的「最优解」
ai·prompt·智能客服·提示词工程·ai应用编程
阿寻寻18 小时前
【人工智能学习260612-软件测试篇】小工具实现 [特殊字符] Prompt工程 + RAG思路 + API调用 + 自动化测试
人工智能·功能测试·学习·prompt
shchojj19 小时前
ChatGPT Prompt Engineering for Developers - Iterative Prompt Development
chatgpt·prompt
jiuLives20 小时前
从 Prompt Engineering 到 Loop Engineering:AI 工程范式的演进
人工智能·prompt
kisdiem1 天前
Few-shot Prompting:让模型从示例中理解任务
prompt
段一凡-华北理工大学1 天前
LangChain框架在高炉炼铁智能化领域的应用~系列文章02:从Prompt开始,让大模型听懂高炉的“黑话“
大数据·人工智能·学习·架构·langchain·prompt·高炉炼铁
kisdiem1 天前
Prompt Engineering完整教程
prompt
TheRouter1 天前
LLM 应用的Prompt 版本管理工程实践:从ad-hoc 字符串到生产级Prompt 仓库
大数据·elasticsearch·ai·prompt