Claude Skills 笔记整理

laplace01232026-02-02 19:03

1) 这次 "Skills" 释放了什么信号？

Skills 不是"又一个功能点" ，更像一个信号：Agent 真正要落地，拼到最后不是模型多聪明，而是有没有一套能稳定交付的「流程资产层」。
业务真正要的是 pass@1：第一次就按要求交付、可复现、可回归，而不是"再想想"给一堆 reasoning。

2) 为什么需要 Skills：模型强，但进真实工作流会反复翻车

常见翻车点（高方差）：

链路一长就漂（步骤遗漏/顺序乱）
约束会忘（关键条件丢失）
工具会乱用（调用不稳、参数偏）
输出格式会飘（今天对、明天漏字段）

结论：模型可以 improvise，但放进长链路跑几次，你会害怕它的方差。

3) 我对 Skills 的定义：不是 prompt 复用，而是把 know-how 变成资产

Skills 更像 工程化的"行为中间层"：

把 know-how 打包成 可复用 / 可版本化 / 可组合 / 可按需加载 的模块
模块里不只自然语言指令，还可以带：
- checklist
- 模板 / 脚本
- 校验器 / schema
含义：把"不该靠模型猜"的部分交给确定性组件保证。

对 agent 特别关键的原因：

agent 落地难点不是"想不想得出来"，而是"能不能稳定地做出来"
现实流程往往"几乎可重复但总有细微变体"（如排障、合规、SOP、发布流程等）

4) Skills 的工程价值：把隐性经验变显性流程，并变成可治理资产

Skills 的意义：

把"隐性经验"→"显性流程"
并把流程变成可治理资产：
- 能 review
- 能 版本控制
- 能回滚
- 能 依赖管理
让 agent 从"会说话的模型"更接近"可运维的系统"。

5) 长任务的现实问题：context rot 与"按需加载"

长任务会遇到 context rot：工具输出越多、上下文越长、噪声越大，模型越容易：
- 把不重要的东西当重点
- 忘掉关键约束
Skills 的关键思路之一：按需加载 / 渐进式加载
- 平时只带技能"描述"
- 需要时再加载完整流程与资源

另一个关键：状态外部化

把状态写入文档或结构化 artifact
等于把"记忆压力"从 tokens 转移到系统状态
对长横向任务的稳定性尤其有帮助

一句话总结（原文核心）

Skills 更像 agent 世界的「流程资产层」：不一定提高智商上限，但能压低方差、提升可交付性。

接下来沿着 Skills 的三条路

路 1：SkillOps ------ 像训练 ML 模型一样规模化更新技能

关注点不是"写出第一版"，而是把同一条 skill 持续迭代到足够稳 ，并且不被少数极端 case 带偏。

一个"训练式批量更新"的流程设想：

海量反馈结构化归因
- 步骤缺失 / 工具调用不稳 / 约束表达不清 / 输出格式漂...
相似失败聚类成可复用改动点
自动生成候选补丁或流程变体
回放 + 回归测试验证
- 既修复失败 case
- 又不破坏历史通过 case
灰度发布 + 指标监控逐步放量
必要时一键回滚

目标：技能更新像模型训练一样------吃大批信号、稳定变好、可控上线，而不是靠人工手改、越改越玄学。

路 2：小模型执行 ------ 训练"执行脑"（procedure exposure + 工具调用）

这条直接影响 agent 的 成本 / 稳定性 / 可控性。

未来形态更像分工协作：

大模型：开放式理解与规划
小模型：执行与工具调用（执行专家）

希望小模型"天生擅长"的能力：

知道何时加载哪个流程（procedure exposure）
最小化上下文
严格执行 steps
把状态写入/读出外部 artifact
做验证与恢复（verify & recover）

如果跑通：agent 系统会更 稳定、便宜、可控，对企业落地更友好。

路 3：Skills Distillation ------ 把流程知识蒸馏进模型，让"按流程办事"成为默认

更长期的方向：

当前 Skills 仍像"外部注入的流程约束"，有点像外挂，每次要把模型拉回轨道。

更想要的是：

把 Skills 沉淀出的流程知识 蒸馏进模型行为
让模型默认具备"按流程办事"的习惯：
- 先找流程再执行
- 主动外部化状态
- 自带 plan → act → verify → recover 节奏
- 对格式和约束更敏感

让 Skills 从"每次搜回来用的工具"升级为"模型天生就这么做"的能力基座。

结尾要点（系统长期跑起来靠什么）

把"怎么做"摆到台面上：变成 可复用、可治理、可持续迭代 的流程资产
真正让系统长期稳定运转的细节往往是：
- 稳定的执行路径
- 可验证的步骤
- 可回归的输出
- 可观测的失败模式

如果你想把这份笔记整理成「更适合 Notion / Obsidian」的版本（加上目录、标签、金句摘录区、可行动 checklist），我也可以直接按你常用格式再排一版。

上一篇：React Native鸿蒙跨平台如何实现分类页面组件通过searchQuery状态变量管理搜索输入，实现了分类的实时过滤功能

下一篇：使用 C# 将 PowerPoint 演示文稿高效转换为 PDF 格式

热门推荐

01GitHub 镜像站点 02Qwen3.5 开源全解析：从 0.8B 到 397B，代际升级 + 全场景选型指南 03OpenClaw 使用和管理 MCP 完全指南 04OpenClaw macOS 完整安装与本地模型配置教程（实战版）05本地部署 OpenClaw + DeepSeek-R1 完全指南 06UV安装并设置国内源 07Openclow安装保姆级教程 08OpenClaw 飞书机器人不回复消息？3 小时踩坑总结 09OpenClaw Control UI安全上下文访问配置 10得物前端部门，没了