grill-me

我用 grill-me 整整一个月了。现在,我几乎在开始每一个任务之前,都会用grill-me给我把关,通过这个skill,让大模型了解我这个任务中,我没有说说清楚的细节。

但真正让我震惊的不是它能做什么,而是它本身------只有5 句话。一个几乎改变了我跟 AI 协作方式的 skill,短到几乎可以写在一张便签纸上。

这让我意识到一件事:一个 AI Skill 的效力,不取决于它写了多少字,而取决于它在哪些维度做了约束。

一张照片,11 个决策

说说我最近的一次使用体验:在一个微信小程序项目里,我想在牌位编辑页加一张照片。

听起来很简单对吧?客户端选图,上传,展示。三个步骤,直觉上只会需要修改app端和api端的代码即可。

我启动了 grill-me SKILL。它居然前后一共问我了 11 个问题:

  • 布局方式:作为 field_layout 条目,和 display_name/birth_death 同级,还是写死位置?
  • 照片样式:直角还是圆角?有边框吗?
  • 无照片时显示什么:空白?占位符?隐藏?
  • 填充方式:contain 还是 cover?
  • 上传接口:新建一个,还是复用管理端已有的 admin/upload?
  • 选图方式:wx.chooseMedia,参数怎么设?
  • 编辑交互:点击照片弹出什么?
  • 创建和编辑是否都支持?
  • Platform 端模板配置要不要支持 photo 类型?
  • 对其他场景的影响:先管还是先不管?
  • 权限:App 端用户能否上传,还是仅限管理员?

其中至少 5 个问题,在我启动 grill-me 之前根本没想过。比如"复用 admin/upload"------看起来省事,实际等于把管理员接口暴露给普通用户;还比如使用"contain vs cover"这样的设计细节,不得不让我佩服。

这就是 AI 通过 grill-me 这个SKILL 做的事情:把"加一张照片"这种看起来一个简单(线性)的需求,拆成一棵决策树。你不需要在写作时就想好所有分支,但你必须在编码前走过所有分支。 真正实现了,我们只需要提供"点子和想法",让AI 来帮我实现的最后一块拼图,即将"点子和想法"转化成更加精确的描述,然后将其喂给AI。

协议 vs 剧本

到目前为止,我也写了不少 prompt、skill 指令,长篇大论,恨不得把每一步该说什么话都写进去。但越写到后面,越觉得这是在限制AI的能力。今天我算是看明白了,我之前写的是"剧本",而grill-me中的内容是协议。

Grill-me 只有 5 条:

  • "Interview me relentlessly..." --- 定调:追问模式
  • "Walk down each branch of the design tree" --- 定方法:深度优先展开
  • "Provide your recommended answer" --- 定立场:AI 要有自己的判断
  • "Ask one at a time" --- 定节奏:一次一个问题
  • "Explore the codebase instead" --- 定边界:先看代码再问

没有一条在教 AI "应该问什么"。它们全在约束 交互方式。这就是协议和剧本的区别。剧本告诉你每一句台词,协议告诉你游戏规则。

协议的代价

但我要说 grill-me 不完美的地方。

协议式交互有它的成本。还是上面提到的那个照片的任务,grill-me 启动时先探索了代码库------一口气烧了 56,524 个 token。原因是它说"为了避免提出已经实现的功能的问题"。

而且 11 个问题回答完,我已经精疲力竭,但这也算是代价吧,但我觉得这个代价是值得的。

需求的问题没有想清楚,后面积累的各种"债务"指不定会在什么时候爆发。

当然,并不是说让grill-me过了一遍需求后,生成的代码就会100%没问题-- 这是不可能的。即使经过了 grill-me 的 11 个问题洗礼,我在后续实现中依然踩了坑:数据库返回的 field_layouts 缺少 photo 字段导致页面显示不全。grill-me 能帮你扫清上游的设计盲区,但下游的执行细节还得自己盯,不过这些问题只能称之为bug,不是架构上和设计上的问题。


如果你还没用过 grill-me,去试试。不是为了用这个 skill,而是为了感受一下"协议式设计"和"剧本式设计"的差距有多大。


references

相关推荐
大鱼>16 天前
大语言模型+物联网:LLM理解物理世界
物联网·struts·语言模型·多模态·aiot
AndrewHZ16 天前
【LLM技术全景】大模型能力探秘:In-Context Learning与思维链(CoT)
人工智能·语言模型·大模型·llm·cot·思维链·icl
生成论实验室16 天前
机器人:一个自主运动的系统
人工智能·算法·语言模型·机器人·自动驾驶·agi·安全架构
Data-Miner16 天前
大语言模型+智能体AI,122页PPT详解落地应用培训!
人工智能·microsoft·语言模型
枫叶林FYL16 天前
BRIDGE:多模态查询的强化学习对齐与文本检索重构
人工智能·语言模型
小小工匠16 天前
拆解大语言模型:从词向量到注意力机制的内部运行原理
人工智能·语言模型·自然语言处理
暮云星影16 天前
瑞芯微rk3588利用Rockchip NPU运行大语言模型(LLM)
arm开发·人工智能·语言模型·自然语言处理
生成论实验室17 天前
自动驾驶:一个自主运动的系统
人工智能·算法·机器学习·语言模型·机器人·自动驾驶·安全架构
searchforAI17 天前
啥是LLM?大语言模型从原理到选型的完整科普
人工智能·科技·深度学习·ai·语言模型·知识图谱·agent
MartinYeung517 天前
[论文学习]重新思考大型语言模型忘却目标:梯度视角与超越
人工智能·学习·语言模型