Claude Skills，4000字详解 Anthropic 的思考

Anthropic 上周出了一个新的技能 skills ,我看了很兴奋

我认为这会引导第三方工具的形态

在看了 3个官方所有对于 skills的描述以后,并进行实践

我认为

Skills = 笔记式形态+ 可执行工具 + AI调度与自优化

这意味着什么?

Skills用你已经会的形态（传统笔记）,让AI既能理解规则,又能调用工具执行任务,还能在使用中自我优化

为什么形态很重要

我上周尝试学习N8N,花了几个小时理解可视化编程的逻辑拖拽节点、连接流程、精确配置每个参数，最后还是放弃了

这是一门新语言,虽然它用图形化界面降低了代码门槛,但本质上还是要求你按照它的语法思考

但Skills的方式,AI直接帮我写完手册并解释需求,整个过程大约半小时

这个数量级的差异来自哪里?

不是Skills的AI更聪明,而是形态的选择

就像我们学中文和学英文的区别如果你本来就会中文,为什么要把想法先翻译成英文,再让别人理解?

能用母语解决的问题,就别强迫自己学外语

Skills选择了笔记这个形态

• 文件夹分类我们每天都在用
• Markdown文档纯文本+几个#号,是目前主流的文档形态
• 自然语言表达中文、English都行,允许模糊

这不是新语言,这是你已经会的东西

形态决定了三件事

1, 门槛

用熟悉的形态,学习成本趋近于零,不需要记新语法、不需要查文档、不需要适应新的思维模式

2, 表达难度

自然语言允许模糊表达,你可以写处理PDF文件时使用,AI会理解,你也可以写PDF相关任务,AI也能懂,而代码或配置语言要求你精确到每个字符

3, 学习难度

因为不是新语言,所以不需要翻译,你脑子里怎么想的,就怎么写,写完AI就能懂,直接执行

渐进式披露的设计哲学

从N个文档到1个文档

在做AI编程的时候,经常需要同时发4-5个文档才能说清楚一个任务

比如要分析数据,我得把

• 数据定义文档
• 查询规则文档
• 报表格式文档
• 历史案例文档
• 注意事项文档

全部一起发给AI

现在用Skills的渐进式披露方式,AI只需要看1个主文档（SKILL,md）,里面会告诉它如果需要详细的查询规则,去看resources/query-guide,md,AI会自己判断需不需要翻开那个文件

从5个文档压缩到1个,这是我能直接感知到的最明显变化

人类用笔记的方式

这个机制其实不是新发明,而是继承了人类用笔记的习惯

复制代码

先看目录 → 判断要不要看某章 → 再看细节

你不会一次性把整本书打开摊在桌上,你会先看目录,判断这次任务需要第3章,然后翻开第3章

Anthropic官方把这个机制命名为渐进式披露（Progressive Disclosure）,分成三层

Level 1元数据层

• 内容name + description
• 作用让AI知道有哪些能力可用
• 类比书的封面和简介

Level 2指令层

• 内容SKILL,md主文件（核心规则+导航）
• 作用告诉AI这个能力怎么用
• 类比书的目录

Level 3资源层

• 内容详细文档、脚本、模板
• 作用提供具体细节和可执行工具
• 类比书的具体章节

核心设计代码不介入上下文

当AI需要运行一个脚本时,脚本代码不会被加载到对话上下文里,AI直接执行,只把输出结果（比如找到3个字段姓名、电话、地址）带回对话,

这让Skills既能调用确定性工具（100%准确的代码）,又不会因为代码本身占用大量上下文

代码×自然语言的分工哲学

两种方案的困境

纯代码方案

• ✅ 100%精准,执行确定
• ❌ 必须穷举所有情况

比如PDF表单的字段名,可能叫姓名、Name、客户名称、联系人,传统自动化要求你为每个变体写一条规则,否则就会失败,

纯自然语言方案

• ✅ 可以处理模糊性和变体
• ✅ 灵活适应新情况

LLM可以理解客户名称就是姓名,但如果让它直接做数据提取、表单填写,精确度无法保证

Skills在同一个SKILL,md中结合两者

scss 复制代码

        代码(100%精准)
              ↓
      确定性任务 ←─────────┐
   (提取、计算、填写)       │
              ↓            │
        SKILL,md  ←─── Skills协调
              ↑            │
      模糊判断 ←─────────┘
 (字段匹配、异常处理)
              ↑
    自然语言(灵活处理)

协调逻辑写在SKILL,md里

• 什么时候用代码（确定性任务）→ 100%准确
• 什么时候用AI（模糊判断）→ 灵活适应
• 两者无缝配合 → 准确 + 灵活

这意味着什么?

你不需要为姓名/Name/客户名称/联系人写4条规则,AI会自动理解它们是同义词,但最终的提取和填写依然由代码执行,保证100%准确

Agent自我进化

传统工具的困境学习成本在人身上

n8n、Zapier这些工具本身不会变聪明,每次优化,都需要人去学习、理解、手动改配置,工具能力固定,人必须持续适应

代码也一样,代码不会自己优化,必须由人来review、重构、改进

学习成本永远在人身上,而且持续高

Skills的突破AI能理解AI的反馈

最让我印象深刻的是双Agent自我进化机制

传统工具的优化流程

复制代码

人学工具 → 人配置 → 人测试 → 人发现问题 → 人改配置

Skills的优化流程

复制代码

AI写手册 → AI测试 → AI发现问题 → AI反馈 → AI改进手册

关键差异因为Skills用自然语言,所以AI能理解AI的反馈

两个AI在对话中完善手册,不需要人把反馈翻译成配置语言或代码语言

我们的角色转变从执行者到判断者

实际使用中,双Agent优化的体验是这样的

1, Agent A根据需求写一个SKILL,md 2, Agent B加载这个手册,执行真实任务 3, 我观察有没有漏（遗漏规则）、有没有错（理解错误）、有没有慢（效率问题） 4, Agent B反馈这个规则不够明确、缺少异常情况处理 5, Agent A改进理解反馈,更新手册 6, 重复迭代越来越精准

我的角色从执行者变成了判断者只需要观察和决策,不需要动手实施

这种角色转变带来的轻松感,比速度提升本身更重要

正向循环能力越强,优化能力越强

复制代码

AI能力提升 → 理解能力提升 → 反馈质量提升 → 优化精准度提升
     ↑                                              ↓
     └──────────────────────────────────────────────┘

随着AI模型本身能力的提升,它理解手册的能力更强,给出的反馈更精准,优化手册的效果也更好

这是传统工具做不到的工具能力固定,无论你多熟练,它都不会变聪明

从AIos视角看Skills

AI应用的完整架构

复制代码

AI应用 = AI系统 + 提示词 + 上下文 + 工具

目前这四个要素都已经成熟

• ✅ AI系统Claude sonnet4,5等大模型
• ✅ 提示词代码 + 自然语言
• ✅ 上下文Skills标准化管理
• ✅ 工具MCP协议连接外部能力

Skills在这个架构中的作用是什么?

传统提示词是或者关系

scss 复制代码

自然语言(灵活但不确定)
         或
代码(确定但刚性)

Skills提示词是并且关系

diff 复制代码

在同一个SKILL,md中
- 代码保证确定性(提取/计算/填写)
- 自然语言保证灵活性(意图理解/变体处理)
- Skills统一管理和调度

对标手机OS的生态

从AIos的角度看,Skills对标的是App生态

scss 复制代码

手机OS
- 系统(iOS/Android) + 应用商店(App Store) + 应用(Apps)

AIos
- 系统(Claude) + 插件市场(Plugins) + 技能(Skills)

Plugins是什么?

Plugins = Skills的打包和分发方式,一个Plugin可以包含多个Skills

比如官方的document-skills这个Plugin包含了Excel、Word、PowerPoint、PDF等多个Skills

官方插件包

Anthropic官方提供了两大插件包

1, document-skills

• 包含Excel、Word、PowerPoint、PDF处理能力
• 适合文档处理、表单填写、数据分析场景

2, example-skills

• 包含skill-creator（创建Skills的指南）、mcp-builder（构建MCP服务器）、canvas-design（可视化设计）、algorithmic-art（算法艺术）等
• 适合学习参考、创作工具、开发示例

安装方式

bash 复制代码

# 第1步添加官方插件市场
/plugin marketplace add anthropics/skills

# 第2步安装你需要的插件包
/plugin install document-skills@anthropic-agent-skills
/plugin install example-skills@anthropic-agent-skills

# 第3步直接对话使用
# AI会自动识别并触发相应的Skill

这些官方案例展示了Skills的完整能力

• 笔记式规则用自然语言写的操作指南
• 可执行工具调用Python库、MCP工具、外部API
• AI调度自动匹配场景、按需加载资源

如果你想深入了解这些案例的具体实现,可以去 https://github,com/anthropics/skills 查看源码和文档,

一些设计洞察

1, 被动识别 vs 主动调用

Skills的一个重要特性是被动识别,而不是传统的命令式调用

传统Command方式

bash 复制代码

你 /weekly-report
AI 执行周报功能
→ 必须记住命令名,一字不差

Skills方式

css 复制代码

你 写周报 / 总结本周 / 帮我整理工作
AI [自动识别→触发周报Skill]
→ 任何表达都可以,AI理解意图

为什么被动识别重要?

这符合人的自然工作方式,你不会对同事说/weekly-report --format=markdown,你会说帮我写个周报

技术实现上,Command是精确字符串匹配,Skills是AI通过description字段理解语义,模糊匹配

2, 不是让AI学你的规则,而是让AI看你怎么做

双Claude测试法的核心原则

不是你猜AI需要什么,而是看AI实际怎么用

传统方式是人穷举所有规则,希望覆盖所有情况,但你永远猜不全边界情况

Skills的方式是让Agent B真实使用,观察它在哪里卡住、哪里理解错了,然后让Agent A根据实际问题改进手册

这是经验主义,不是理性主义

3, 形态即语言

为什么笔记形态这么重要?因为形态本身就是一种语言

当你选择可视化编程（n8n）,你就选择了节点+连线的语言,这门语言精确、确定,但也刚性、难学

当你选择代码（Python/JavaScript）,你就选择了语法+逻辑的语言,这门语言强大、灵活,但也要求你会写代码

当你选择笔记（Markdown+自然语言）,你就选择了人类思考的语言,这门语言模糊、宽松,但也是你本来就会的

Skills的创新不是发明新语言,而是选对了语言

三个本质

回到开头的定义

Skills = 笔记式规则 + 可执行工具 + AI调度与自优化

现在我们可以更深入地理解这三个要素

1, 笔记式规则 = 形态选择

不是发明新语言,而是用人人都会的母语,形态决定门槛、决定表达、决定迁移成本

2, 可执行工具 = 分工哲学

代码负责确定性,AI负责灵活性,在同一个SKILL,md中无缝协调,不是或者,是并且

3, AI调度与自优化 = 学习成本转移

传统工具能力固定,人单向适应,Skills让AI能理解AI的反馈,形成自我进化闭环,学习成本从人转移到机器,

最后一个洞察

Skills不是工具,而是范式

它不是又一个新的自动化平台,而是重新定义了如何让AI理解人的意图并执行任务,就像Markdown不是又一个文字处理器,而是重新定义了如何用纯文本表达格式

当你理解了这个范式,你会发现很多场景都可以用这个思路重构不是教AI新语言,而是让AI说人话,不是穷举所有规则,而是让AI在实践中学习,不是单纯堆砌工具,而是让代码和AI各司其职

这可能是AI时代的笔记革命笔记不再只是静态知识库,而是会思考、会执行、会进化的操作系统