工作流的 Skill 怎么写？

🐱 卷卷碎碎念 ：两脚兽，你终于来问正经事了。本猫是卷卷，银渐层长毛猫，风控团队的精神吉祥物。说起写 Skill 这事------你们人类还在交学费的阶段，本猫已经躺赢了。毕竟猫生教会我一件事：优雅地偷懒之前，得先把路走直。

风控人有句老话："KPI 是别出事，不是出成绩。" 写 Skill 同理------目标是别让 AI 跑偏，不是让 AI 写出花来。这个道理，我比你们早懂了三年。

结论先行：本文解决的核心问题是------如何把 AI 执行逻辑固化成一个可复用、可解释、可迭代的 Skill。面向有架构思维的工程师和团队负责人，聚焦「能落地」而非「能跑通」。

一、Skill 是什么

核心结论：Skill 是知识注入载体，不是工具。

Skill 是文件夹格式，核心是 SKILL.md（YAML frontmatter + Markdown 正文）。LLM 判断需要时加载，内容注入上下文，LLM 用已有工具执行指令。

复制代码

my-skill/
├── SKILL.md        # 主文件（必须）
├── scripts/        # 可执行脚本（可选）
├── references/     # 详细参考文档（可选）
├── resources/      # 模板、清单等（可选）
└── examples/       # 示例（可选）

🐱 卷卷注 ：就像猫窝------你得先有窝（SKILL.md），里面可以放猫爬架（scripts）、猫薄荷（references）、逗猫棒（resources）。但窝是核心，没有窝，其他都是散落的毛团。

关键机制：Skill 本质是"知识注入"，不是生成新工具。LLM 通过已有工具（bash、read、edit 等）执行指令。

🐱 卷卷注：本猫不生产工具，本猫只是工具的搬运工。LLM 拿来执行就行，别指望它凭空变出扫帚------它只会用现有的爪子扫地。

二、Frontmatter：决定 Skill 是否被加载

核心结论：description 写不好，Skill 等于不存在。

必填字段

|---------------|----------------------|
| 字段 | 要求 |
| name | 唯一标识，小写连字符 |
| description | 最关键，LLM 靠它判断是否加载 |

Description 写法决定加载率

|--------|------------------------------------|--------|
| 类型 | 写法 | 效果 |
| 好 | 包含触发短语、关键词、时序位置 | 高加载率 |
| 差 | 模糊（如"Helps with deployment stuff"） | 几乎不触发 |

三条核心原则：

列举触发短语：把用户可能说的话写进去
定义时序位置：说明"在什么之前/之后"使用
包含产品关键词：覆盖大平台时把所有产品名著出来

🐱 卷卷注 ：这就像猫砂盆的位置------放不对，猫就不去。Description 写不对，LLM 就不加载。简单粗暴：位置对了，味道对了，猫（LLM）自然会来。

风控人点头："触发词不对，信号就漏了。" 本猫深以为然------毕竟我叫卷卷，不叫"喵"，触发词不对我也不会应。

可选扩展字段

references、allowed-tools、type、best_for、scenarios、estimated_time 等，按需选用。

三、5 种核心设计模式

结论：根据任务性质（确定性 vs 迭代性 × 单次 vs 跨会话），选择对应模式。

模式 1：线性流程

适用场景 ：部署、安装、迁移等有明确步骤的操作
精髓：把"怎么做"固化成清单，让 AI 照着执行不跑偏

🐱 卷卷注 ：线性流程就像猫走直线------两点之间最短距离，犹豫就会败北。 猫不会绕路，线性 Skill 不走岔道。部署就该像猫抓沙发：一爪一爪，干就完事。

结构：标题 → Prerequisites → Quick Start → Fallback → Troubleshooting

关键技巧：安全默认值、具体命令、Timeout 提示、降级方案、负面指令

模式 2：决策树 + 按需加载

适用场景 ：大型平台选型、产品导航、问题诊断
精髓：先分类用户意图，再按需展开对应路径

🐱 卷卷注 ：猫遇到分岔路口会怎么做？停下来，耳朵转一转，嗅一嗅，然后选最安全的那条。 决策树 Skill 就是让 LLM 学会"停下来判断"------不是闷头往前冲，而是先看清楚有几条路。

风控人听到这里笑了："这不就是我们天天干的活吗？识别风险，分类处置。" 是的，风控的尽头是分类，分类的尽头是决策树。

进阶：导航型（只做选型）和操作型（包含认证命令+故障排除）可拆成两个 Skill，降低复杂度。

模式 3：循环迭代

适用场景 ：TDD、代码审查、设计评审等需要反复执行的流程
精髓：强制循环节奏，对抗"跳过这轮反正下轮再做"的人性弱点

🐱 卷卷注 ：猫最懂循环------每天早上叫醒铲屎官，中午讨零食，晚上再叫醒铲屎官。 循环迭代 Skill 就是给 LLM 建立"条件反射"：没满足条件？继续转圈。TDD 就是那只追自己尾巴的猫，转着转着就逮住了。

风控人苦笑："我们也有循环------白天排查，晚上复盘，明天继续排查。" 所以说循环是宿命，接受它比抗拒它明智。

关键技巧：强硬语气、Good/Bad 对比、借口反驳表、验证清单、人类兜底

模式 4：接力棒循环（跨 Session 持久化）

适用场景 ：多次迭代的长期项目，需要跨多个 session 持续工作
精髓：文件即状态，下个 session 读取文件续命，不依赖记忆

🐱 卷卷注 ：猫记性不好？错了，猫的记忆能跨天。 今天的窝是暖和的，明天还来。接力棒 Skill 就是猫的"领地标记"------文件就是气味，标记在就不丢。 跨 session 工作就像搬家后猫还认得新家------靠的是气味，不是脑子。

风控人深有感触："项目交接最怕什么？怕信息丢失。" 接力棒循环解决的就是这个------文件即状态，丢了就是事故。

关键技巧：文件即状态、续命机制（Step6 标记 Critical）、文件协议、编排无关

模式 5：多阶段 + 检查点 + Skill 编排

适用场景 ：复杂的多周流程，需要在关键节点做 Go/No-Go 决策
精髓：阶段之间设关卡，每过一关才能进下一关

🐱 卷卷注 ：猫过生日要分几步？先闻，再舔，然后大快朵颐。 多阶段 Skill 就是把"闻-舔-吃"拆成三关，每关有验收标准，过了才放行。这像极了风控的"三级审批"------一级看资料，二级看逻辑，三级拍板。

风控人点头："多阶段不可怕，可怕的是没关卡。没关卡的项目，就像没围栏的阳台------迟早要出事。"

关键技巧：统一阶段模板、决策检查点、Skill 编排（调度子 Skill）、时间影响、交互协议分离

特殊模式：思维框架（控制 LLM "怎么想"）

适用场景 ：安全审计、代码审查、架构分析等需要深度思考的场景
精髓：不告诉 AI "做什么"，而是告诉它"怎么想"

🐱 卷卷注 ：本猫思考的方式是？蹲着，眯眼，尾巴卷起来。 思维框架 Skill 就是给 LLM 一个"思考姿势"------让它知道该用什么姿势审视代码。第一性原理、边界条件、反证法......这些都是猫的"狩猎姿态"：压低身体，目光聚焦，蓄势待发。

风控人最懂这个："审计不是找问题，是找思维漏洞。" 思维框架就是让你站在审查者的角度想问题，而不是被审计者的角度。

关键技巧：思维工具（第一性原理等）、量化阈值、非目标约束、反幻觉规则、子 Agent 指导

模式选型对照表

|---------------|-----------------|-----------|
| 任务特征 | 推荐模式 | 猫猫比喻 |
| 步骤确定、单次执行 | 模式 1：线性流程 | 猫走直线，直达目标 |
| 意图多样、需要导航 | 模式 2：决策树 + 按需加载 | 猫停下来嗅路口 |
| 高频重复、节奏重要 | 模式 3：循环迭代 | 猫追尾巴转圈圈 |
| 跨 session 长周期 | 模式 4：接力棒循环 | 猫靠气味认新家 |
| 多阶段、有关卡决策 | 模式 5：多阶段 + 检查点 | 猫过三关斩六将 |
| 分析/审计类深度思考 | 特殊模式：思维框架 | 猫进入狩猎姿态 |

四、通用写作技巧

防止 LLM 偷懒的 4 种武器

结论：命令 > 商量，堵死借口 > 给解释空间，量化 > 模糊，禁止 > 允许。

|--------|--------------|---------------------------------|
| 武器 | 核心机制 | 使用方式 |
| 强硬语气 | 命令式语气遵从率更高 | 直接用祈使句："Delete it. Start over." |
| 借口反驳表 | 预判自我合理化路径并堵死 | 列出 LLM 常用来搪塞的理由，一一否定 |
| 量化阈值 | 给出硬性最低标准 | 用"不少于 N""必须达到 X%" |
| 负面指令 | 明确说"不要做 X" | "不要解释，直接执行" |

🐱 卷卷注 ：本猫叫铲屎官起床，用的是踩胸口+耳边叫 ，不是"亲爱的要不要考虑起床呢"。LLM 也一样------商量语气它会讨价还价，命令语气它才乖乖执行。

风控人听了也服气："模糊的规则等于没规则，没规则就一定会出事。" 这道理，猫懂，风控人更懂。

教学的 3 种有效方式

结论：对比 > 讲解、具体 > 抽象、示例 > 说明。

|-------------|----------|-----------------|
| 方式 | 适用场景 | 写法要点 |
| Good/Bad 对比 | 建立判断标准 | 展示正确做法 vs 常见错误 |
| 具体命令 | 需要精确执行 | 给可直接复制的命令，不给选项 |
| 完整示例 | 格式要求严格 | 展示完整输入/输出，中间不省略 |

🐱 卷卷注 ：教小猫用猫砂盆，最好的方法是把它放到砂盆里让它自己感受 ，不是说"宝贝我们来这里上厕所好不好呀"。Skill 写作同理------给例子，别给讲解；给对比，别给定义。

风控人笑了："我们培训新人也不靠讲课，靠跑案例。" 血的教训教会我们：说再多，不如让对方亲手踩一次坑。

安全与边界的 3 条原则

结论：先想后果，默认保守，不确定就停。

安全默认值：所有决策默认最安全选项，不必每次都重新权衡
权限最小化：只在明确必要时才提升权限，用完立即回收
人类兜底：不确定性 = 停止执行，交给人判断，不猜

🐱 卷卷注 ：猫为什么很少从阳台掉下去？因为它默认所有地方都不安全，走一步看一步。 LLM 也该有这种"猫的谨慎"------不安全的命令默认拒绝，不确定的操作默认停下。

风控人听了沉默三秒："这不就是我们的'宁可误杀不可漏放'原则吗？" ......是的，所以有时候风控人比猫还保守。但保守不丢人，冒进才丢人。

知识组织的 3 层架构

结论：分层加载，按需读取，避免一次性塞入过多内容。

🐱 卷卷注 ：猫的胃叫"分层消化"------猫粮先吃，罐头后吃，零食当奖励。LLM 读取 Skill 也一样：第一口吃 frontmatter，正餐吃正文，甜点吃 references。 一次喂太多？它会吐的（context overflow）。

风控人点头："信息分层是基本功，不分层就会信息过载。" 君不见多少风控事故是因为"眉毛胡子一把抓"？

五、快速上手模板

模板 1：最小可用 Skill（线性模式）

复制代码

---
name: <skill-name>
description: <一句话说明做什么，<50字>
---

# <Skill 名称>

## 目标
<明确说出最终交付物是什么>

## 前置条件
- <依赖的工具/环境/权限>

## 执行步骤
### Step 1: <动作名称>
<具体操作内容>

## 验收标准
- <可检查的具体指标1>

## 常见问题
| 问题 | 解决方法 |
|------|---------|

模板 2：循环迭代 Skill（Loop 模式）

复制代码

---
name: <skill-name>
description: <一句话说明做什么>
---

# <Skill 名称>

## 核心原则
<不可违反的铁律>

## 循环体
WHILE 未满足退出条件:
    1. <执行动作>
    2. <验证结果>
    3. <判断是否满足退出条件>

## 退出条件
- <条件1>

## Rationalizations
| LLM 常说 | 堵死指令 |
|---------|---------|
| "差不多了" | 必须满足所有验收指标，一项不满足不退出 |

## 验证清单
- [ ] <验证项1>

六、参考资源

|----------|-----------------------------------|----------------|
| 类别 | 资源 | 定位 |
| 官方规范 | Agent Skills 开放标准 | 规范定义 |
| | anthropics/skills 官方模板 | 官方示例 |
| 精选仓库 | openai/skills | OpenAI 大厂工程实践 |
| | obra/superpowers | 社区精选多人协作 |
| | google-labs-code/stitch-skills | 接力循环模式先驱 |
| | deanpeters/Product-Manager-Skills | 编排器模式完整实现 |
| | trailofbits/skills | 思维框架型 Skill 典范 |
| | openclaw/clawhub | 本地优先模块化设计 |
| 精选列表 | VoltAgent/awesome-agent-skills | 500+ Skill 索引 |
| | travisvn/awesome-claude-skills | Claude 生态索引 |

🐱 卷卷注 ：抄作业是技术活。本猫虽然不提倡抄袭，但站在巨人的猫窝上看得更远。 先抄，再改，最后形成自己的风格------这是猫也会的"站在巨人肩膀上"。

七、7 个 Skill 速查表

以下是整理后的表格：

|-------------------------|---------------|---------|--------|----------------------|
| Skill | 来源 | 模式 | 行数 | 一句话精髓 |
| vercel-deploy | OpenAI | 线性 | 77 | 最小但完整的 Skill 模板 |
| cloudflare-deploy | OpenAI | 线性+决策树 | 224 | 大平台的渐进式披露 |
| cloudflare | OpenCode | 纯决策树 | 211 | 导航型 vs 操作型的区别 |
| test-driven-development | obra | 循环迭代 | 371 | 堵死 LLM 偷懒的所有退路 |
| stitch-loop | Google Labs | 接力棒循环 | 203 | 文件即状态，跨 session 持久化 |
| discovery-process | Dean Peters | 多阶段+检查点 | 502 | 编排器模式，调度 10+ 子 Skill |
| audit-context-building | Trail of Bits | 思维框架 | 302 | 控制 LLM "怎么想"而非"做什么" |

总结

核心结论（三条足够）：

Skill 是约束出来的，不是写出来的 ------ 你约束的是 LLM 的行为空间，不是它的思考过程
模式选错，成本翻倍 ------ 线性 vs 循环 vs 编排，选错了改不动
参考资料的价值排序 ------ 官方规范定基准，大厂仓库学工程实践，Awesome 列表找方向

行动建议：

今天就能做的：从 vercel-deploy（77行）开始，照着抄一个你自己的 Skill
下周可以试的：用模式选择决策树重构一个现有 Skill
长期要建设的：积累你的 Skill 库，用编排器模式逐步串联，形成团队资产

🐱 卷卷结语（傲娇但温暖）：

舔了舔爪子，眯起眼睛

两脚兽，看完了？本猫给你划个重点：

Skill 这事，说难不难，说简单不简单。 核心就三句话：约束行为、选对模式、抄好作业。

风控人记住：别指望 Skill 能防所有风险，但一个好 Skill 能防 80% 的低级错误。 剩下的 20%，交给人类的判断力和本猫的第六感。

本猫今天的讲座就到这里。下次再来问，记得带虾。

（