工作流的 Skill 怎么写?

🐱 卷卷碎碎念 :两脚兽,你终于来问正经事了。本猫是卷卷,银渐层长毛猫,风控团队的精神吉祥物。说起写 Skill 这事------你们人类还在交学费的阶段,本猫已经躺赢了。毕竟猫生教会我一件事:优雅地偷懒之前,得先把路走直。

风控人有句老话:"KPI 是别出事,不是出成绩。" 写 Skill 同理------目标是别让 AI 跑偏,不是让 AI 写出花来。这个道理,我比你们早懂了三年。


结论先行:本文解决的核心问题是------如何把 AI 执行逻辑固化成一个可复用、可解释、可迭代的 Skill。面向有架构思维的工程师和团队负责人,聚焦「能落地」而非「能跑通」。


一、Skill 是什么

核心结论:Skill 是知识注入载体,不是工具。

Skill 是文件夹格式,核心是 SKILL.md(YAML frontmatter + Markdown 正文)。LLM 判断需要时加载,内容注入上下文,LLM 用已有工具执行指令。

复制代码
my-skill/
├── SKILL.md        # 主文件(必须)
├── scripts/        # 可执行脚本(可选)
├── references/     # 详细参考文档(可选)
├── resources/      # 模板、清单等(可选)
└── examples/       # 示例(可选)

🐱 卷卷注 :就像猫窝------你得先有窝(SKILL.md),里面可以放猫爬架(scripts)、猫薄荷(references)、逗猫棒(resources)。但窝是核心,没有窝,其他都是散落的毛团。

关键机制:Skill 本质是"知识注入",不是生成新工具。LLM 通过已有工具(bash、read、edit 等)执行指令。

🐱 卷卷注:本猫不生产工具,本猫只是工具的搬运工。LLM 拿来执行就行,别指望它凭空变出扫帚------它只会用现有的爪子扫地。


二、Frontmatter:决定 Skill 是否被加载

核心结论:description 写不好,Skill 等于不存在。

必填字段

|---------------|----------------------|
| 字段 | 要求 |
| name | 唯一标识,小写连字符 |
| description | 最关键,LLM 靠它判断是否加载 |

Description 写法决定加载率

|--------|------------------------------------|--------|
| 类型 | 写法 | 效果 |
| | 包含触发短语、关键词、时序位置 | 高加载率 |
| | 模糊(如"Helps with deployment stuff") | 几乎不触发 |

三条核心原则

  • 列举触发短语:把用户可能说的话写进去
  • 定义时序位置:说明"在什么之前/之后"使用
  • 包含产品关键词:覆盖大平台时把所有产品名著出来

🐱 卷卷注 :这就像猫砂盆的位置------放不对,猫就不去。Description 写不对,LLM 就不加载。简单粗暴:位置对了,味道对了,猫(LLM)自然会来。

风控人点头:"触发词不对,信号就漏了。" 本猫深以为然------毕竟我叫卷卷,不叫"喵",触发词不对我也不会应。

可选扩展字段

referencesallowed-toolstypebest_forscenariosestimated_time 等,按需选用。

三、5 种核心设计模式

结论:根据任务性质(确定性 vs 迭代性 × 单次 vs 跨会话),选择对应模式。


模式 1:线性流程

适用场景 :部署、安装、迁移等有明确步骤的操作
精髓:把"怎么做"固化成清单,让 AI 照着执行不跑偏

🐱 卷卷注 :线性流程就像猫走直线------两点之间最短距离,犹豫就会败北。 猫不会绕路,线性 Skill 不走岔道。部署就该像猫抓沙发:一爪一爪,干就完事。

结构:标题 → Prerequisites → Quick Start → Fallback → Troubleshooting

关键技巧:安全默认值、具体命令、Timeout 提示、降级方案、负面指令


模式 2:决策树 + 按需加载

适用场景 :大型平台选型、产品导航、问题诊断
精髓:先分类用户意图,再按需展开对应路径

🐱 卷卷注 :猫遇到分岔路口会怎么做?停下来,耳朵转一转,嗅一嗅,然后选最安全的那条。 决策树 Skill 就是让 LLM 学会"停下来判断"------不是闷头往前冲,而是先看清楚有几条路。

风控人听到这里笑了:"这不就是我们天天干的活吗?识别风险,分类处置。" 是的,风控的尽头是分类,分类的尽头是决策树。

进阶:导航型(只做选型)和操作型(包含认证命令+故障排除)可拆成两个 Skill,降低复杂度。


模式 3:循环迭代

适用场景 :TDD、代码审查、设计评审等需要反复执行的流程
精髓:强制循环节奏,对抗"跳过这轮反正下轮再做"的人性弱点

🐱 卷卷注 :猫最懂循环------每天早上叫醒铲屎官,中午讨零食,晚上再叫醒铲屎官。 循环迭代 Skill 就是给 LLM 建立"条件反射":没满足条件?继续转圈。TDD 就是那只追自己尾巴的猫,转着转着就逮住了。

风控人苦笑:"我们也有循环------白天排查,晚上复盘,明天继续排查。" 所以说循环是宿命,接受它比抗拒它明智。

关键技巧:强硬语气、Good/Bad 对比、借口反驳表、验证清单、人类兜底


模式 4:接力棒循环(跨 Session 持久化)

适用场景 :多次迭代的长期项目,需要跨多个 session 持续工作
精髓:文件即状态,下个 session 读取文件续命,不依赖记忆

🐱 卷卷注 :猫记性不好?错了,猫的记忆能跨天。 今天的窝是暖和的,明天还来。接力棒 Skill 就是猫的"领地标记"------文件就是气味,标记在就不丢。 跨 session 工作就像搬家后猫还认得新家------靠的是气味,不是脑子。

风控人深有感触:"项目交接最怕什么?怕信息丢失。" 接力棒循环解决的就是这个------文件即状态,丢了就是事故。

关键技巧:文件即状态、续命机制(Step6 标记 Critical)、文件协议、编排无关


模式 5:多阶段 + 检查点 + Skill 编排

适用场景 :复杂的多周流程,需要在关键节点做 Go/No-Go 决策
精髓:阶段之间设关卡,每过一关才能进下一关

🐱 卷卷注 :猫过生日要分几步?先闻,再舔,然后大快朵颐。 多阶段 Skill 就是把"闻-舔-吃"拆成三关,每关有验收标准,过了才放行。这像极了风控的"三级审批"------一级看资料,二级看逻辑,三级拍板。

风控人点头:"多阶段不可怕,可怕的是没关卡。没关卡的项目,就像没围栏的阳台------迟早要出事。"

关键技巧:统一阶段模板、决策检查点、Skill 编排(调度子 Skill)、时间影响、交互协议分离


特殊模式:思维框架(控制 LLM "怎么想")

适用场景 :安全审计、代码审查、架构分析等需要深度思考的场景
精髓:不告诉 AI "做什么",而是告诉它"怎么想"

🐱 卷卷注 :本猫思考的方式是?蹲着,眯眼,尾巴卷起来。 思维框架 Skill 就是给 LLM 一个"思考姿势"------让它知道该用什么姿势审视代码。第一性原理、边界条件、反证法......这些都是猫的"狩猎姿态":压低身体,目光聚焦,蓄势待发。

风控人最懂这个:"审计不是找问题,是找思维漏洞。" 思维框架就是让你站在审查者的角度想问题,而不是被审计者的角度。

关键技巧:思维工具(第一性原理等)、量化阈值、非目标约束、反幻觉规则、子 Agent 指导

模式选型对照表

|---------------|-----------------|-----------|
| 任务特征 | 推荐模式 | 猫猫比喻 |
| 步骤确定、单次执行 | 模式 1:线性流程 | 猫走直线,直达目标 |
| 意图多样、需要导航 | 模式 2:决策树 + 按需加载 | 猫停下来嗅路口 |
| 高频重复、节奏重要 | 模式 3:循环迭代 | 猫追尾巴转圈圈 |
| 跨 session 长周期 | 模式 4:接力棒循环 | 猫靠气味认新家 |
| 多阶段、有关卡决策 | 模式 5:多阶段 + 检查点 | 猫过三关斩六将 |
| 分析/审计类深度思考 | 特殊模式:思维框架 | 猫进入狩猎姿态 |


四、通用写作技巧

防止 LLM 偷懒的 4 种武器

结论:命令 > 商量,堵死借口 > 给解释空间,量化 > 模糊,禁止 > 允许。

|--------|--------------|---------------------------------|
| 武器 | 核心机制 | 使用方式 |
| 强硬语气 | 命令式语气遵从率更高 | 直接用祈使句:"Delete it. Start over." |
| 借口反驳表 | 预判自我合理化路径并堵死 | 列出 LLM 常用来搪塞的理由,一一否定 |
| 量化阈值 | 给出硬性最低标准 | 用"不少于 N""必须达到 X%" |
| 负面指令 | 明确说"不要做 X" | "不要解释,直接执行" |

🐱 卷卷注 :本猫叫铲屎官起床,用的是踩胸口+耳边叫 ,不是"亲爱的要不要考虑起床呢"。LLM 也一样------商量语气它会讨价还价,命令语气它才乖乖执行。

风控人听了也服气:"模糊的规则等于没规则,没规则就一定会出事。" 这道理,猫懂,风控人更懂。


教学的 3 种有效方式

结论:对比 > 讲解、具体 > 抽象、示例 > 说明。

|-------------|----------|-----------------|
| 方式 | 适用场景 | 写法要点 |
| Good/Bad 对比 | 建立判断标准 | 展示正确做法 vs 常见错误 |
| 具体命令 | 需要精确执行 | 给可直接复制的命令,不给选项 |
| 完整示例 | 格式要求严格 | 展示完整输入/输出,中间不省略 |

🐱 卷卷注 :教小猫用猫砂盆,最好的方法是把它放到砂盆里让它自己感受 ,不是说"宝贝我们来这里上厕所好不好呀"。Skill 写作同理------给例子,别给讲解;给对比,别给定义。

风控人笑了:"我们培训新人也不靠讲课,靠跑案例。" 血的教训教会我们:说再多,不如让对方亲手踩一次坑。


安全与边界的 3 条原则

结论:先想后果,默认保守,不确定就停。

  • 安全默认值:所有决策默认最安全选项,不必每次都重新权衡
  • 权限最小化:只在明确必要时才提升权限,用完立即回收
  • 人类兜底:不确定性 = 停止执行,交给人判断,不猜

🐱 卷卷注 :猫为什么很少从阳台掉下去?因为它默认所有地方都不安全,走一步看一步。 LLM 也该有这种"猫的谨慎"------不安全的命令默认拒绝,不确定的操作默认停下。

风控人听了沉默三秒:"这不就是我们的'宁可误杀不可漏放'原则吗?" ......是的,所以有时候风控人比猫还保守。但保守不丢人,冒进才丢人。


知识组织的 3 层架构

结论:分层加载,按需读取,避免一次性塞入过多内容。

🐱 卷卷注 :猫的胃叫"分层消化"------猫粮先吃,罐头后吃,零食当奖励。LLM 读取 Skill 也一样:第一口吃 frontmatter,正餐吃正文,甜点吃 references。 一次喂太多?它会吐的(context overflow)。

风控人点头:"信息分层是基本功,不分层就会信息过载。" 君不见多少风控事故是因为"眉毛胡子一把抓"?


五、快速上手模板

模板 1:最小可用 Skill(线性模式)

复制代码
---
name: <skill-name>
description: <一句话说明做什么,<50字>
---

# <Skill 名称>

## 目标
<明确说出最终交付物是什么>

## 前置条件
- <依赖的工具/环境/权限>

## 执行步骤
### Step 1: <动作名称>
<具体操作内容>

## 验收标准
- <可检查的具体指标1>

## 常见问题
| 问题 | 解决方法 |
|------|---------|

模板 2:循环迭代 Skill(Loop 模式)

复制代码
---
name: <skill-name>
description: <一句话说明做什么>
---

# <Skill 名称>

## 核心原则
<不可违反的铁律>

## 循环体
WHILE 未满足退出条件:
    1. <执行动作>
    2. <验证结果>
    3. <判断是否满足退出条件>

## 退出条件
- <条件1>

## Rationalizations
| LLM 常说 | 堵死指令 |
|---------|---------|
| "差不多了" | 必须满足所有验收指标,一项不满足不退出 |

## 验证清单
- [ ] <验证项1>

六、参考资源

|----------|-----------------------------------|----------------|
| 类别 | 资源 | 定位 |
| 官方规范 | Agent Skills 开放标准 | 规范定义 |
| | anthropics/skills 官方模板 | 官方示例 |
| 精选仓库 | openai/skills | OpenAI 大厂工程实践 |
| | obra/superpowers | 社区精选多人协作 |
| | google-labs-code/stitch-skills | 接力循环模式先驱 |
| | deanpeters/Product-Manager-Skills | 编排器模式完整实现 |
| | trailofbits/skills | 思维框架型 Skill 典范 |
| | openclaw/clawhub | 本地优先模块化设计 |
| 精选列表 | VoltAgent/awesome-agent-skills | 500+ Skill 索引 |
| | travisvn/awesome-claude-skills | Claude 生态索引 |

🐱 卷卷注 :抄作业是技术活。本猫虽然不提倡抄袭,但站在巨人的猫窝上看得更远。 先抄,再改,最后形成自己的风格------这是猫也会的"站在巨人肩膀上"。


七、7 个 Skill 速查表

以下是整理后的表格:

|-------------------------|---------------|---------|--------|----------------------|
| Skill | 来源 | 模式 | 行数 | 一句话精髓 |
| vercel-deploy | OpenAI | 线性 | 77 | 最小但完整的 Skill 模板 |
| cloudflare-deploy | OpenAI | 线性+决策树 | 224 | 大平台的渐进式披露 |
| cloudflare | OpenCode | 纯决策树 | 211 | 导航型 vs 操作型的区别 |
| test-driven-development | obra | 循环迭代 | 371 | 堵死 LLM 偷懒的所有退路 |
| stitch-loop | Google Labs | 接力棒循环 | 203 | 文件即状态,跨 session 持久化 |
| discovery-process | Dean Peters | 多阶段+检查点 | 502 | 编排器模式,调度 10+ 子 Skill |
| audit-context-building | Trail of Bits | 思维框架 | 302 | 控制 LLM "怎么想"而非"做什么" |


总结

核心结论(三条足够):

  1. Skill 是约束出来的,不是写出来的 ------ 你约束的是 LLM 的行为空间,不是它的思考过程
  2. 模式选错,成本翻倍 ------ 线性 vs 循环 vs 编排,选错了改不动
  3. 参考资料的价值排序 ------ 官方规范定基准,大厂仓库学工程实践,Awesome 列表找方向

行动建议:

  • 今天就能做的:从 vercel-deploy(77行)开始,照着抄一个你自己的 Skill
  • 下周可以试的:用模式选择决策树重构一个现有 Skill
  • 长期要建设的:积累你的 Skill 库,用编排器模式逐步串联,形成团队资产

🐱 卷卷结语(傲娇但温暖):

舔了舔爪子,眯起眼睛

两脚兽,看完了?本猫给你划个重点:

Skill 这事,说难不难,说简单不简单。 核心就三句话:约束行为、选对模式、抄好作业。

风控人记住:别指望 Skill 能防所有风险,但一个好 Skill 能防 80% 的低级错误。 剩下的 20%,交给人类的判断力和本猫的第六感。

本猫今天的讲座就到这里。下次再来问,记得带虾。

相关推荐
步步为营DotNet2 小时前
探究.NET 11 中 Semantic Kernel 在 AI 驱动后端开发的前沿应用
人工智能·.net
帐篷Li2 小时前
【Vibe Coding】一口气搞懂AI黑话:Vibe Coding、Agent、提示词、MCP、Skills全解析
人工智能·microsoft
星辰徐哥2 小时前
云边端一体化解析:什么是云边端,为何能成为AI基础设施核心
人工智能·ai·云边端
还是大剑师兰特2 小时前
Pinia介绍及Vue3配置示例
前端·javascript·vue.js
拉什福德Rashford2 小时前
一个人就是一支影视团队:实测国内最强影视级 AI 视频创作平台 TapNow——告别抽卡,导演级精准控制
人工智能·科技·ai作画·aigc·音视频·产品经理
搜狐技术产品小编20232 小时前
AI Rules
人工智能
昨夜见军贴06162 小时前
IA-Lab AI 检测报告生成助手:土壤重金属检测报告如何实现GB 15618标准自动解析,推动降本与合规双升级?
大数据·人工智能
OpenVINO 中文社区2 小时前
4.13直播 | 端侧多模态模型应用开发Skill实战
人工智能
前端摸鱼匠2 小时前
【AI大模型春招面试题17】 过拟合、欠拟合在大模型中的表现与解决策略?
人工智能·ai·语言模型·面试·大模型