Anthropic 上周出了一个 新的技能 skills ,我看了很兴奋
我认为这会引导 第三方工具 的形态

在看了 3个官方所有对于 skills的描述以后,并进行实践
我认为
Skills = 笔记式形态+ 可执行工具 + AI调度与自优化
这意味着什么?
Skills用你已经会的形态(传统笔记),让AI既能理解规则,又能调用工具执行任务,还能在使用中自我优化
为什么形态很重要
我上周尝试学习N8N,花了几个小时理解可视化编程的逻辑拖拽节点、连接流程、精确配置每个参数,最后还是放弃了
这是一门新语言,虽然它用图形化界面降低了代码门槛,但本质上还是要求你按照它的语法思考
但Skills的方式,AI直接帮我写完手册并解释需求,整个过程大约半小时
这个数量级的差异来自哪里?
不是Skills的AI更聪明,而是形态的选择
就像我们学中文和学英文的区别如果你本来就会中文,为什么要把想法先翻译成英文,再让别人理解?
能用母语解决的问题,就别强迫自己学外语
Skills选择了笔记这个形态
- • 文件夹分类我们每天都在用
- • Markdown文档纯文本+几个#号,是目前主流的文档形态
- • 自然语言表达中文、English都行,允许模糊
这不是新语言,这是你已经会的东西
形态决定了三件事
1, 门槛
用熟悉的形态,学习成本趋近于零,不需要记新语法、不需要查文档、不需要适应新的思维模式
2, 表达难度
自然语言允许模糊表达,你可以写处理PDF文件时使用,AI会理解,你也可以写PDF相关任务,AI也能懂,而代码或配置语言要求你精确到每个字符
3, 学习难度
因为不是新语言,所以不需要翻译,你脑子里怎么想的,就怎么写,写完AI就能懂,直接执行
渐进式披露的设计哲学
从N个文档到1个文档
在做AI编程的时候,经常需要同时发4-5个文档才能说清楚一个任务
比如要分析数据,我得把
- • 数据定义文档
- • 查询规则文档
- • 报表格式文档
- • 历史案例文档
- • 注意事项文档
全部一起发给AI
现在用Skills的渐进式披露方式,AI只需要看1个主文档(SKILL,md),里面会告诉它如果需要详细的查询规则,去看resources/query-guide,md,AI会自己判断需不需要翻开那个文件
从5个文档压缩到1个,这是我能直接感知到的最明显变化
人类用笔记的方式
这个机制其实不是新发明,而是继承了人类用笔记的习惯
先看目录 → 判断要不要看某章 → 再看细节
你不会一次性把整本书打开摊在桌上,你会先看目录,判断这次任务需要第3章,然后翻开第3章
Anthropic官方把这个机制命名为渐进式披露(Progressive Disclosure),分成三层
Level 1元数据层
- • 内容name + description
- • 作用让AI知道有哪些能力可用
- • 类比书的封面和简介
Level 2指令层
- • 内容SKILL,md主文件(核心规则+导航)
- • 作用告诉AI这个能力怎么用
- • 类比书的目录
Level 3资源层
- • 内容详细文档、脚本、模板
- • 作用提供具体细节和可执行工具
- • 类比书的具体章节
核心设计代码不介入上下文
当AI需要运行一个脚本时,脚本代码不会被加载到对话上下文里,AI直接执行,只把输出结果(比如找到3个字段姓名、电话、地址)带回对话,
这让Skills既能调用确定性工具(100%准确的代码),又不会因为代码本身占用大量上下文
代码×自然语言的分工哲学
两种方案的困境
纯代码方案
- • ✅ 100%精准,执行确定
- • ❌ 必须穷举所有情况
比如PDF表单的字段名,可能叫姓名、Name、客户名称、联系人,传统自动化要求你为每个变体写一条规则,否则就会失败,
纯自然语言方案
- • ✅ 可以处理模糊性和变体
- • ✅ 灵活适应新情况
LLM可以理解客户名称就是姓名,但如果让它直接做数据提取、表单填写,精确度无法保证
Skills在同一个SKILL,md中结合两者
scss
代码(100%精准)
↓
确定性任务 ←─────────┐
(提取、计算、填写) │
↓ │
SKILL,md ←─── Skills协调
↑ │
模糊判断 ←─────────┘
(字段匹配、异常处理)
↑
自然语言(灵活处理)
协调逻辑写在SKILL,md里
- • 什么时候用代码(确定性任务)→ 100%准确
- • 什么时候用AI(模糊判断)→ 灵活适应
- • 两者无缝配合 → 准确 + 灵活
这意味着什么?
你不需要为姓名/Name/客户名称/联系人写4条规则,AI会自动理解它们是同义词,但最终的提取和填写依然由代码执行,保证100%准确
Agent自我进化
传统工具的困境学习成本在人身上
n8n、Zapier这些工具本身不会变聪明,每次优化,都需要人去学习、理解、手动改配置,工具能力固定,人必须持续适应
代码也一样,代码不会自己优化,必须由人来review、重构、改进
学习成本永远在人身上,而且持续高
Skills的突破AI能理解AI的反馈
最让我印象深刻的是双Agent自我进化机制
传统工具的优化流程
人学工具 → 人配置 → 人测试 → 人发现问题 → 人改配置
Skills的优化流程
AI写手册 → AI测试 → AI发现问题 → AI反馈 → AI改进手册
关键差异因为Skills用自然语言,所以AI能理解AI的反馈
两个AI在对话中完善手册,不需要人把反馈翻译成配置语言或代码语言
我们的角色转变从执行者到判断者
实际使用中,双Agent优化的体验是这样的
1, Agent A根据需求写一个SKILL,md 2, Agent B加载这个手册,执行真实任务 3, 我观察有没有漏(遗漏规则)、有没有错(理解错误)、有没有慢(效率问题) 4, Agent B反馈这个规则不够明确、缺少异常情况处理 5, Agent A改进理解反馈,更新手册 6, 重复迭代越来越精准
我的角色从执行者变成了判断者只需要观察和决策,不需要动手实施
这种角色转变带来的轻松感,比速度提升本身更重要
正向循环能力越强,优化能力越强
AI能力提升 → 理解能力提升 → 反馈质量提升 → 优化精准度提升
↑ ↓
└──────────────────────────────────────────────┘
随着AI模型本身能力的提升,它理解手册的能力更强,给出的反馈更精准,优化手册的效果也更好
这是传统工具做不到的工具能力固定,无论你多熟练,它都不会变聪明
从AIos视角看Skills
AI应用的完整架构
AI应用 = AI系统 + 提示词 + 上下文 + 工具
目前这四个要素都已经成熟
- • ✅ AI系统Claude sonnet4,5等大模型
- • ✅ 提示词代码 + 自然语言
- • ✅ 上下文Skills标准化管理
- • ✅ 工具MCP协议连接外部能力
Skills在这个架构中的作用是什么?
传统提示词是或者关系
scss
自然语言(灵活但不确定)
或
代码(确定但刚性)
Skills提示词是并且关系
diff
在同一个SKILL,md中
- 代码保证确定性(提取/计算/填写)
- 自然语言保证灵活性(意图理解/变体处理)
- Skills统一管理和调度
对标手机OS的生态
从AIos的角度看,Skills对标的是App生态
scss
手机OS
- 系统(iOS/Android) + 应用商店(App Store) + 应用(Apps)
AIos
- 系统(Claude) + 插件市场(Plugins) + 技能(Skills)
Plugins是什么?
Plugins = Skills的打包和分发方式,一个Plugin可以包含多个Skills
比如官方的document-skills
这个Plugin包含了Excel、Word、PowerPoint、PDF等多个Skills
官方插件包
Anthropic官方提供了两大插件包
1, document-skills
- • 包含Excel、Word、PowerPoint、PDF处理能力
- • 适合文档处理、表单填写、数据分析场景
2, example-skills
- • 包含skill-creator(创建Skills的指南)、mcp-builder(构建MCP服务器)、canvas-design(可视化设计)、algorithmic-art(算法艺术)等
- • 适合学习参考、创作工具、开发示例
安装方式
bash
# 第1步添加官方插件市场
/plugin marketplace add anthropics/skills
# 第2步安装你需要的插件包
/plugin install document-skills@anthropic-agent-skills
/plugin install example-skills@anthropic-agent-skills
# 第3步直接对话使用
# AI会自动识别并触发相应的Skill
这些官方案例展示了Skills的完整能力
- • 笔记式规则用自然语言写的操作指南
- • 可执行工具调用Python库、MCP工具、外部API
- • AI调度自动匹配场景、按需加载资源
如果你想深入了解这些案例的具体实现,可以去 https://github,com/anthropics/skills 查看源码和文档,
一些设计洞察
1, 被动识别 vs 主动调用
Skills的一个重要特性是被动识别,而不是传统的命令式调用
传统Command方式
bash
你 /weekly-report
AI 执行周报功能
→ 必须记住命令名,一字不差
Skills方式
css
你 写周报 / 总结本周 / 帮我整理工作
AI [自动识别→触发周报Skill]
→ 任何表达都可以,AI理解意图
为什么被动识别重要?
这符合人的自然工作方式,你不会对同事说/weekly-report --format=markdown,你会说帮我写个周报
技术实现上,Command是精确字符串匹配,Skills是AI通过description字段理解语义,模糊匹配
2, 不是让AI学你的规则,而是让AI看你怎么做
双Claude测试法的核心原则
不是你猜AI需要什么,而是看AI实际怎么用
传统方式是人穷举所有规则,希望覆盖所有情况,但你永远猜不全边界情况
Skills的方式是让Agent B真实使用,观察它在哪里卡住、哪里理解错了,然后让Agent A根据实际问题改进手册
这是经验主义,不是理性主义
3, 形态即语言
为什么笔记形态这么重要?因为形态本身就是一种语言
当你选择可视化编程(n8n),你就选择了节点+连线的语言,这门语言精确、确定,但也刚性、难学
当你选择代码(Python/JavaScript),你就选择了语法+逻辑的语言,这门语言强大、灵活,但也要求你会写代码
当你选择笔记(Markdown+自然语言),你就选择了人类思考的语言,这门语言模糊、宽松,但也是你本来就会的
Skills的创新不是发明新语言,而是选对了语言
三个本质
回到开头的定义
Skills = 笔记式规则 + 可执行工具 + AI调度与自优化
现在我们可以更深入地理解这三个要素
1, 笔记式规则 = 形态选择
不是发明新语言,而是用人人都会的母语,形态决定门槛、决定表达、决定迁移成本
2, 可执行工具 = 分工哲学
代码负责确定性,AI负责灵活性,在同一个SKILL,md中无缝协调,不是或者,是并且
3, AI调度与自优化 = 学习成本转移
传统工具能力固定,人单向适应,Skills让AI能理解AI的反馈,形成自我进化闭环,学习成本从人转移到机器,
最后一个洞察
Skills不是工具,而是范式
它不是又一个新的自动化平台,而是重新定义了如何让AI理解人的意图并执行任务,就像Markdown不是又一个文字处理器,而是重新定义了如何用纯文本表达格式
当你理解了这个范式,你会发现很多场景都可以用这个思路重构不是教AI新语言,而是让AI说人话,不是穷举所有规则,而是让AI在实践中学习,不是单纯堆砌工具,而是让代码和AI各司其职
这可能是AI时代的笔记革命笔记不再只是静态知识库,而是会思考、会执行、会进化的操作系统
