从零开始理解 Agent Skills - 认识 Agent Skills

📚 本教程旨在帮助你从零开始理解 Agent Skills ------ 一个为 AI Agent 赋予新能力的开放格式规范。

第一章:认识 Agent Skills

本章将带你了解 Agent Skills 是什么、它解决了什么问题,以及整个项目的架构全貌。

1.1 什么是 Agent Skills?

Agent Skills (Agent 技能)是一个开放格式规范,用于为 AI Agent(如 GitHub Copilot、Claude Code、OpenAI Codex 等)赋予新的能力和专业知识。

简单来说:Skill 就是一个文件夹 ,里面包含一个 SKILL.md 文件,告诉 AI Agent 如何完成某个特定任务。

perl 复制代码
my-skill/
├── SKILL.md          # 必需:元数据 + 指令
├── scripts/          # 可选:可执行脚本
├── references/       # 可选:参考文档
└── assets/           # 可选:模板、资源

一个直观的类比

你可以把 Agent Skills 理解为AI 世界的"插件系统"

类比对象 Agent Skills
浏览器插件 给浏览器增加新功能
VS Code 扩展 给编辑器增加新功能
Agent Skills 给 AI Agent 增加新能力

不同之处在于:Agent Skills 是纯文本驱动的------不需要编译、不需要特殊 API,只需要写 Markdown 文件。

1.2 它解决了什么问题?

问题:AI Agent 能力有限

即便是最强大的 AI 模型,也有以下局限性:

  1. 知识有截止日期:不了解你公司内部的 API、流程和约定
  2. 缺乏领域专业知识:不知道你项目的特殊规范和最佳实践
  3. 没有项目上下文:不了解你团队的代码风格、架构决策和工具链

解决方案:用 Skills 扩展能力

Agent Skills 让你可以:

  • ✅ 教 Agent 使用你公司特定的工具和流程
  • ✅ 分享领域专业知识(如 PDF 处理、数据分析的最佳实践)
  • ✅ 创建可复用的任务模板
  • ✅ 在不同 Agent 平台之间共享技能(一次编写,到处使用)
graph LR subgraph 没有 Skills A["AI Agent"] -->|能力有限| B["只能用通用知识回答"] end subgraph 有了 Skills C["AI Agent"] -->|加载 Skill| D["PDF 处理技能"] C -->|加载 Skill| E["代码审查技能"] C -->|加载 Skill| F["数据分析技能"] D --> G["拥有专业能力"] E --> G F --> G end

1.3 Agent Skills 的特点

🔓 开放格式

  • 任何人都可以创建和分享 Skills
  • 不绑定特定的 AI 平台
  • Apache 2.0 开源许可

📝 简单直接

  • 核心只是 Markdown + YAML 的组合
  • 不需要编译或安装
  • 人可读、AI 可用

🔄 跨平台兼容

  • 支持 Claude Code、GitHub Copilot、VS Code、OpenAI Codex 等
  • 一次编写,多个平台可用

📦 可组合

  • Skills 是独立的文件夹,可以任意组合
  • 支持渐进式加载,不浪费上下文窗口
  • 可以通过 Git 版本管理

1.4 项目架构全貌

Agent Skills 项目包含三个主要部分:

graph TB subgraph "Agent Skills 项目" A["📋 格式规范
(Specification)"] B["📚 官方文档
(docs/)"] C["🐍 Python 参考库
(skills-ref/)"] end A -->|定义了| D["SKILL.md 文件格式"] A -->|定义了| E["目录结构约定"] A -->|定义了| F["命名规则和验证约束"] B -->|包含| G["入门教程"] B -->|包含| H["最佳实践"] B -->|包含| I["客户端集成指南"] C -->|提供| J["解析器 parser"] C -->|提供| K["验证器 validator"] C -->|提供| L["提示词生成 prompt"] C -->|提供| M["命令行工具 CLI"] style A fill:#4CAF50,color:#fff style B fill:#2196F3,color:#fff style C fill:#FF9800,color:#fff

三大组成部分

组件 路径 描述
格式规范 docs/specification.mdx 定义 SKILL.md 的完整格式
官方文档 docs/ 教程、最佳实践、集成指南
参考库 skills-ref/ Python 实现的解析、验证和工具库

1.5 一个 Skill 长什么样?

下面是一个最简单的 Skill 示例------一个掷骰子技能:

objectivec 复制代码
roll-dice/
└── SKILL.md

SKILL.md 的内容:

markdown 复制代码
---
name: roll-dice
description: Roll dice using a random number generator. Use when asked to roll a die (d6, d20, etc.).
---

To roll a die, use the following command:

```bash
echo $((RANDOM % <sides> + 1))
```

Replace `<sides>` with the number of sides on the die.

就是这么简单!这个文件包含:

  • Frontmatter--- 之间的部分):定义名称和描述
  • 正文--- 之后的部分):AI Agent 要遵循的指令

1.6 工作流程概览

当 AI Agent 使用 Skills 时,会经历以下三个阶段:

sequenceDiagram participant U as 用户 participant A as AI Agent participant S as Skill 文件 Note over A: 🔍 阶段一:发现(Discovery) A->>S: 扫描 Skills 目录 S-->>A: 返回每个 Skill 的 name + description Note over A: 只加载轻量元数据(~100 tokens/skill) U->>A: "帮我掷一个 D20" Note over A: ⚡ 阶段二:激活(Activation) A->>A: 匹配用户请求与 Skill 描述 A->>S: 读取 roll-dice/SKILL.md 完整内容 S-->>A: 返回完整指令(<5000 tokens) Note over A: 🚀 阶段三:执行(Execution) A->>A: 按照 SKILL.md 指令操作 A-->>U: "你掷出了 17!🎲"

这就是所谓的渐进式披露(Progressive Disclosure)------Agent 不会一次性加载所有 Skills 的完整内容,而是按需加载,保持上下文窗口高效利用。

1.7 谁在使用 Agent Skills?

Agent Skills 由 Anthropic 维护,但已被多个主流 AI 平台采纳:

  • Claude Code --- Anthropic 的 AI 编程工具
  • GitHub Copilot --- 在 VS Code 中使用
  • OpenAI Codex --- OpenAI 的编程 Agent
  • 以及更多正在接入的平台...

1.8 本章小结

要点 说明
Agent Skills 是什么 为 AI Agent 提供新能力的开放格式规范
核心文件 SKILL.md(YAML frontmatter + Markdown 指令)
关键机制 渐进式披露(发现 → 激活 → 执行)
跨平台 一次编写,多平台使用
项目组成 格式规范 + 官方文档 + Python 参考库

➡️ 下一章:核心概念 --- 深入理解渐进式披露、SKILL.md 文件格式等关键概念。

相关推荐
小村儿3 小时前
马斯克AI战略封神!解散xAI,租算力,收购Cursor
openai·cursor·grok
爱吃的小肥羊5 小时前
Codex 居然能剪视频了!我实测了两个案例,结果出乎意料
aigc·openai
阿里云云原生6 小时前
Agent 构建变轻、Agent 架构变薄,什么正在变厚?
agent
机器之心7 小时前
马斯克官宣xAI解散,22万张GPU算力租给Anthropic
人工智能·openai
机器之心7 小时前
DeepMind入股硬核网游EVE,要让AI学「黑暗森林」
人工智能·openai
机器之心7 小时前
TRAE SOLO移动端上线,手机也能干活了,随时随地Vibe Working
人工智能·openai
Java后端的Ai之路8 小时前
以为AI开发就是调接口?一场25K的面试让我看到真相,原来真正的技术深度在这!
人工智能·面试·职场和发展·agent·ai应用开发
爱吃的小肥羊8 小时前
ChatGPT低价订阅集体翻车,薅羊毛时代结束了!
aigc·openai
阿维的博客日记8 小时前
什么是 MCP(模型上下文协议)?它解决了什么问题?
agent·functioncalling·mcp
爱听歌的周童鞋8 小时前
Learn-Claude-Code | 笔记 | Collaboration | s11 Autonomous Agents
笔记·llm·agent·claude code·collaboration·autonomous