Agent Skills:AI 能力扩展的新范式

当 AI 也学会了"装插件",普通用户离定制专属 AI 还有多远?

2024 年 10 月 16 日,Anthropic 给出了一个优雅的答案------Agent Skills 。这不是又一个需要编程基础的开发者工具,而是一种让每个人都能轻松扩展 AI 能力的新范式。

那么,它和年初推出的 MCP 又有什么区别?👇 让我们来一探究竟。

⏰本篇文章将从以下几个部分介绍

  1. 核心概念
  2. 技术原理
  3. 为什么需要?与 MCP 的区别是什么?
  4. 预构建 Skills && 快速上手
  5. 实际应用
  6. 常见问题

核心概念

💡 什么是 Agent Skills?

Agent Skills 是扩展 Claude 功能的模块化能力 。每个 Skill 包含元数据、指令和资源和代码(脚本、模板),Claude 会在相关时自动调用,无需编写代码,也不会耗费大量无用 tokens

🎯 典型场景

场景 传统方式 使用 Agent Skills
📊 数据报告 手动创建 Excel 自动生成专业电子表格
📄 PDF 处理 尝试读取,易出错 精确提取文本和表格
🎨 演示文稿 从零设计排版 快速创建格式精美的 PPT
📝 文档编写 反复调整格式 生成符合规范的 Word

✨ 核心优势

特性 说明 价值
即插即用 自动识别调用 零学习成本
渐进加载 按需消耗 tokens 高效节约
确定性执行 代码运行非推理 100% 准确
沙箱隔离 安全环境运行 可信可靠

技术原理

🧠 渐进式披露架构

Agent Skills 的核心创新是按需分阶段加载,而非预先消耗上下文。

三层加载机制

第 1 级:元数据(始终加载,<100 tokens)

yaml 复制代码
name: pdf-processing

description: 提取 PDF 文本和表格。在用户上传 PDF 时使用。

第 2 级:指令(触发时加载)

markdown 复制代码
## 何时使用

- 用户上传 PDF 文件

- 需要提取文本或表格

## 步骤

1. 使用 pdf_extract.py 提取内容

2. 解析表格结构

3. 格式化输出

第 3 级:资源(执行时加载)

bash 复制代码
skills/pdf-processing/
├── SKILL.md # 1、2 级
├── pdf_extract.py # 3 级(执行时)
└── table_parser.py # 3 级(执行时)

🏗️ 执行流程

复制代码
用户输入
↓
Claude 理解意图
↓
第 1 级:检查元数据(所有 Skills 已在内存)
↓
第 2 级:加载匹配 Skill 的指令
↓
第 3 级:执行代码(沙箱环境)
↓
返回结果

🔒 安全机制

关键原则

⚠️ 只使用可信来源的 Skills:

  • ✅ Anthropic 官方 Skills

  • ✅ 你自己创建的 Skills

  • ❌ 不受信任的第三方 Skills

为什么需要谨慎?

  1. 工具滥用风险:恶意 Skill 可能滥用文件操作、bash 命令

  2. 数据泄露风险:可能向外部系统泄露敏感信息

  3. 外部依赖风险:从外部 URL 获取数据的 Skills 特别危险

运行环境约束

  • 无网络访问:无法调用外部 API

  • 无运行时安装:只能使用预安装的包

  • 沙箱隔离:严格的资源限制

Skills 架构

Skills 在代码执行环境中运行,Claude 具有文件系统访问、bash 命令和代码执行功能。可以这样想:Skills 作为虚拟机上的目录存在,Claude 使用与您在计算机上导航文件相同的 bash 命令与它们交互。

skills 也是有局限性的,他只能使用在 claude 生态的产品中,在其余模型生态中是无法使用skills,官方目前也仅仅提供了部分skill,如需实现特定场合的工具,还需自定义去实现相应的skill,生态/广场还是略有不足的地方。

自定义时也是要按照官方给出来的特定结构实现,才可以正常的在claude中生效。

为什么需要?

问题 1:LLM 不擅长精确的结构化操作

python 复制代码
# ❌ 传统方式

用户:"创建一个销售数据 Excel 表格"

Claude:[描述结构,但无法生成真实文件]

  

# ✅ 使用 Excel Skill

用户:"创建一个销售数据 Excel 表格"

Claude:✅ 已创建 sales_data.xlsx(可下载)

问题 2:专业任务需要领域最佳实践

处理 PDF 的对比:

维度 传统方式 PDF Skill
表格识别 可能遗漏 ✅ 100% 识别
跨页处理 容易断开 ✅ 自动合并
格式保持 丢失样式 ✅ 保持原样
输出格式 纯文本 ✅ CSV/Excel

效果:准确率提升 95%,速度快 10 倍!

问题 3:减少重复指导,提高效率

**以前:**每次都要说明主题、排版、字体、图表样式... **现在:**这些最佳实践都内置在 Skill 中,按需自动加载。

与 MCP 的区别

很多人会疑惑:既然有了 MCP,为什么还需要 Agent Skills?

本质区别:简单性 vs 灵活性的权衡

🎭 类比理解

ini 复制代码
Agent Skills = 手机自带的"快捷指令"

✓ 系统内安全运行

✓ 无需联网

✓ 功能固定但高效

  

MCP = 完整的第三方 App

✓ 需要安装授权

✓ 可访问外部资源

✓ 功能强大但复杂

📊 详细对比

维度 Agent Skills MCP
运行位置 Claude 内部 独立服务器
配置难度 ⭐ 零配置 ⭐⭐⭐ 需编程
响应速度 🚀 毫秒级 ⏱️ 可能延迟
外部访问 ❌ 不支持 ✅ 支持
适用场景 标准化任务 复杂业务逻辑
维护成本 🟢 零维护 🟡 需运维

💡 选择指南

使用 Agent Skills:

  • ✅ 文档处理(Office、PDF)

  • ✅ 标准化工作流

  • ✅ 公司流程/行业规范

  • ✅ 代码执行环境内任务

使用 MCP:

  • ✅ 本地文件系统访问

  • ✅ 数据库/API 连接

  • ✅ 实时数据查询

  • ✅ 需要网络的任务

最佳实践:

复制代码
Agent Skills(标准任务)+ MCP(外部系统)= 完美组合 💯

预构建 Skills

Anthropic 为常见文档任务提供了 4 个官方 Skills,所有用户可在 claude.ai 和 Claude API 中使用:

📊 Excel (xlsx)

功能: 创建电子表格、分析数据、生成图表报告

arduino 复制代码
示例:

用户:"分析销售数据,生成带图表的 Excel"

Claude:✅ 数据透视表 + 柱状图 + 条件格式

→ sales_analysis.xlsx

📄 PDF (pdf)

功能: 提取文本和表格、填充表单、合并文档

arduino 复制代码
示例:

用户:"提取 PDF 中的所有表格"

Claude:✅ 识别 5 个表格 + 保持格式 + 输出 CSV

快速上手

🚀 体验预构建 Skills

  1. 打开 claude.ai

  2. 输入任务

arduino 复制代码
"创建一个包含 Q1-Q4 销售数据的 Excel 表格,

包含柱状图和数据透视表"

🛠️ 创建自定义 Skill

Step 1:编写 SKILL.md

markdown 复制代码
---

name: homework-grader

description: 批改数学作业并提供详细反馈,识别常见错误模式

---

# 作业批改助手
## 何时使用
- 用户上传数学作业

- 需要批改和反馈

## 执行步骤

1. 检查答案正确性

2. 识别解题步骤中的错误

3. 提供改进建议

4. 生成详细反馈报告

## 示例

输入:学生作业 PDF

输出:批改结果 + 错误分析 + 改进建议

Step 2:上传和使用

在 Claude Code 中:

bash 复制代码
# 放入项目目录

.claude/skills/homework-grader/SKILL.md

# 或全局目录

~/.claude/skills/homework-grader/SKILL.md

通过 API:

python 复制代码
from anthropic import Anthropic

client =  Anthropic()

# 上传 Skill

with  open("SKILL.md",  "rb")  as f:

skill = client.beta.skills.create(

file=f,

betas=["skills-2025-10-02"]

)

# 使用 Skill

message = client.messages.create(

model="claude-4-sonnet-20250514",

messages=[{"role": "user",  "content": "批改这份作业"}],

skills=[{"type": "custom",  "id": skill.id}]

)

claude.ai 中:

  1. 设置 → Skills → Upload Custom Skill

  2. 上传 SKILL.md

  3. 在对话中 Claude 会自动调用

Step 3:字段要求

name(必需):

  • 最多 64 个字符

  • 只能包含小写字母、数字、连字符

  • 不能包含:「anthropic」、「claude」

description(必需):

  • 必须非空,最多 1024 字符

  • 说明 Skill 功能和使用时机

完整目录结构:

perl 复制代码
my-skill/
├── SKILL.md # 必需
├── script.py # 可选:脚本
├── data/ # 可选:数据
│ └── templates.json
└── docs/ # 可选:文档
└── examples.md

实际应用

🎓 教育:作业批改助手

场景: 数学老师需要批改 30 份作业

Skill 设计:

markdown 复制代码
---

name: math-homework-grader

description: 自动批改数学作业,识别常见错误

---

## 评分标准

- 答案正确性(60%)

- 解题步骤完整性(30%)

- 书写规范性(10%)

## 输出格式

- 总分 + 分项得分

- 错题详解

- 改进建议

效果: 批改时间从 2 小时 → 10 分钟

💼 企业:代码审查流程

场景: 公司需要统一代码审查标准

Skill 设计:

markdown 复制代码
---

name: company-code-review

description: 执行公司代码审查标准

---

  

## 检查项
- 遵循 PEP 8 / ESLint 规范

- 扫描 SQL 注入和 XSS 漏洞

- 验证函数文档完整性

- 确保测试覆盖率 >80%

## 输出
- 问题清单(按严重程度分级)

- 修改建议

- 合规性评分

效果: 审查时间减少 60% ,问题检出率提升 40%

常见问题

Q1: Skills 需要付费吗?

A: 取决于版本:

  • 免费版:可使用基础 Skills,有频率限制

  • Pro 版($20/月):无限制使用所有 Skills

  • 建议:偶尔使用选免费版,专业工作选 Pro

Q2: Skills 能访问本地文件吗?

A: 不能。Skills 在沙箱中运行,无法访问文件、网络或系统资源。需要这些功能请使用 MCP。

Q3: 如何知道调用了哪个 Skill?

A: Claude 会标注,例如:[使用了 Excel Skill]

Q4: 可以禁用某些 Skills 吗?

A: 可以!在设置中管理 Skills 列表。

Q5: Skills 支持中文吗?

A: 完全支持多语言输入和输出。

Q6: 自定义 Skills 会跨平台同步吗?

A: 目前不会。上传到 API 的 Skills 不会出现在 claude.ai,反之亦然。需要分别管理。

🌟 生态未来发展

范式转变

回顾计算机历史的抽象层次提升:

复制代码
机器码 → 汇编 → 高级语言 → 图形界面 → 自然语言
↓ ↓ ↓ ↓ ↓
专家 专业人员 开发者 普通用户 所有人


Agent Skills(快速简单)

↕️ 互补

MCP(强大灵活)

↕️ 共同构建

完整的 AI 工具生态 🌟

🎯 核心价值

Agent Skills 的出现,标志着 AI 能力扩展进入"平民化"时代

维度 价值
🔓 降低门槛 不需要编程技能
提升效率 标准化任务自动完成
🎯 确保质量 代码执行保证准确性
🔒 安全可靠 沙箱隔离 + 官方认证

最后

1960 年代,Alan Kay 说:

"预测未来的最好方式,就是创造它。"

Agent Skills 让这句话有了新含义:现在,不只是程序员能"创造未来",每个人都可以。

工具不仅改变我们做事的方式,更会改变我们思考的方式:

  • 有了计算器 → 敢于处理复杂问题

  • 有了拼写检查 → 专注于表达而非拼写

  • 有了 Agent Skills → 专注于创造而非执行

这才是 Agent Skills 最深远的意义:让人类回归最擅长的事------想象、创造、决策,把执行交给 AI。

未来已来,AI 定制时代就在眼前! 🚀

参考资源

📚 官方文档

相关推荐
AI大模型2 小时前
谷歌这本 68 页提示词手册,才是 Gemini 3 Pro 的完全体「附官方内功心法」
程序员·llm·agent
奇舞精选2 小时前
Claude Agent Skills:将 Workflow 打进技能包
agent·claude
FreeCode21 小时前
LangGraph1.0智能体开发:运行时系统
python·langchain·agent
大模型教程1 天前
智能体变笨了是什么原因? 怎么优化?
程序员·llm·agent
大模型教程1 天前
检索增强生成(RAG)与大语言模型微调(Fine-tuning)的差异、优势及使用场景详解
程序员·llm·agent
AI大模型1 天前
索引 ≠ 检索!RAG 高手都在用的六种知识表示方法
程序员·llm·agent
AI大模型1 天前
用AI这么久了,你知道什么是大模型吗?看这里,3分钟让你入门
程序员·llm·agent
let_code1 天前
CopilotKit-丝滑连接agent和应用-理论篇
前端·agent·ai编程
后端小肥肠1 天前
小佛陀漫画怎么做?深扒中老年高互动赛道,用n8n流水线批量打造
人工智能·aigc·agent