grill-me

我用 grill-me 整整一个月了。现在,我几乎在开始每一个任务之前,都会用grill-me给我把关,通过这个skill,让大模型了解我这个任务中,我没有说说清楚的细节。

但真正让我震惊的不是它能做什么,而是它本身------只有5 句话。一个几乎改变了我跟 AI 协作方式的 skill,短到几乎可以写在一张便签纸上。

这让我意识到一件事:一个 AI Skill 的效力,不取决于它写了多少字,而取决于它在哪些维度做了约束。

一张照片,11 个决策

说说我最近的一次使用体验:在一个微信小程序项目里,我想在牌位编辑页加一张照片。

听起来很简单对吧?客户端选图,上传,展示。三个步骤,直觉上只会需要修改app端和api端的代码即可。

我启动了 grill-me SKILL。它居然前后一共问我了 11 个问题:

  • 布局方式:作为 field_layout 条目,和 display_name/birth_death 同级,还是写死位置?
  • 照片样式:直角还是圆角?有边框吗?
  • 无照片时显示什么:空白?占位符?隐藏?
  • 填充方式:contain 还是 cover?
  • 上传接口:新建一个,还是复用管理端已有的 admin/upload?
  • 选图方式:wx.chooseMedia,参数怎么设?
  • 编辑交互:点击照片弹出什么?
  • 创建和编辑是否都支持?
  • Platform 端模板配置要不要支持 photo 类型?
  • 对其他场景的影响:先管还是先不管?
  • 权限:App 端用户能否上传,还是仅限管理员?

其中至少 5 个问题,在我启动 grill-me 之前根本没想过。比如"复用 admin/upload"------看起来省事,实际等于把管理员接口暴露给普通用户;还比如使用"contain vs cover"这样的设计细节,不得不让我佩服。

这就是 AI 通过 grill-me 这个SKILL 做的事情:把"加一张照片"这种看起来一个简单(线性)的需求,拆成一棵决策树。你不需要在写作时就想好所有分支,但你必须在编码前走过所有分支。 真正实现了,我们只需要提供"点子和想法",让AI 来帮我实现的最后一块拼图,即将"点子和想法"转化成更加精确的描述,然后将其喂给AI。

协议 vs 剧本

到目前为止,我也写了不少 prompt、skill 指令,长篇大论,恨不得把每一步该说什么话都写进去。但越写到后面,越觉得这是在限制AI的能力。今天我算是看明白了,我之前写的是"剧本",而grill-me中的内容是协议。

Grill-me 只有 5 条:

  • "Interview me relentlessly..." --- 定调:追问模式
  • "Walk down each branch of the design tree" --- 定方法:深度优先展开
  • "Provide your recommended answer" --- 定立场:AI 要有自己的判断
  • "Ask one at a time" --- 定节奏:一次一个问题
  • "Explore the codebase instead" --- 定边界:先看代码再问

没有一条在教 AI "应该问什么"。它们全在约束 交互方式。这就是协议和剧本的区别。剧本告诉你每一句台词,协议告诉你游戏规则。

协议的代价

但我要说 grill-me 不完美的地方。

协议式交互有它的成本。还是上面提到的那个照片的任务,grill-me 启动时先探索了代码库------一口气烧了 56,524 个 token。原因是它说"为了避免提出已经实现的功能的问题"。

而且 11 个问题回答完,我已经精疲力竭,但这也算是代价吧,但我觉得这个代价是值得的。

需求的问题没有想清楚,后面积累的各种"债务"指不定会在什么时候爆发。

当然,并不是说让grill-me过了一遍需求后,生成的代码就会100%没问题-- 这是不可能的。即使经过了 grill-me 的 11 个问题洗礼,我在后续实现中依然踩了坑:数据库返回的 field_layouts 缺少 photo 字段导致页面显示不全。grill-me 能帮你扫清上游的设计盲区,但下游的执行细节还得自己盯,不过这些问题只能称之为bug,不是架构上和设计上的问题。


如果你还没用过 grill-me,去试试。不是为了用这个 skill,而是为了感受一下"协议式设计"和"剧本式设计"的差距有多大。


references

相关推荐
MartinYeung52 小时前
[论文学习]LoRA-Leak:针对 LoRA 微调语言模型的成员推断攻击深度分析与隐私风险评估
人工智能·学习·语言模型
硅谷秋水3 小时前
物理人工智能的驾驭工程:机器人中间件是驾驭层
人工智能·机器学习·语言模型·中间件·机器人
必胜刻3 小时前
Go项目实战:使用Ollama本地部署大模型实现AI智能笔记生成
人工智能·笔记·ai·语言模型·golang
毒爪的小新4 小时前
Open WebUI 从零到一:打造属于你的私人ChatGPT
linux·ai·语言模型·chatgpt·openwebui
DisonTangor15 小时前
谷歌开源首个扩散大语言模型——DiffusionGemma
人工智能·语言模型·自然语言处理·开源·aigc·transformer
我爱cope16 小时前
【Agent智能体26 | 多智能体-多智能体工作流】
人工智能·设计模式·语言模型·职场和发展
装不满的克莱因瓶19 小时前
自然语言处理发展历史——从规则系统到大语言模型的演进之路
网络·人工智能·python·深度学习·语言模型·自然语言处理
装不满的克莱因瓶20 小时前
RLHF中的PPO算法——大语言模型对齐优化的核心引擎
人工智能·python·深度学习·算法·机器学习·语言模型·自然语言处理
AndrewHZ1 天前
【LLM技术全景】开源大模型生态:如何选择适合你的基座模型?
人工智能·深度学习·语言模型·开源·llm·transformer·基座模型