从零开始理解 Agent Skills - 认识 Agent Skills

📚 本教程旨在帮助你从零开始理解 Agent Skills ------ 一个为 AI Agent 赋予新能力的开放格式规范。

第一章:认识 Agent Skills

本章将带你了解 Agent Skills 是什么、它解决了什么问题,以及整个项目的架构全貌。

1.1 什么是 Agent Skills?

Agent Skills (Agent 技能)是一个开放格式规范,用于为 AI Agent(如 GitHub Copilot、Claude Code、OpenAI Codex 等)赋予新的能力和专业知识。

简单来说:Skill 就是一个文件夹 ,里面包含一个 SKILL.md 文件,告诉 AI Agent 如何完成某个特定任务。

perl 复制代码
my-skill/
├── SKILL.md          # 必需:元数据 + 指令
├── scripts/          # 可选:可执行脚本
├── references/       # 可选:参考文档
└── assets/           # 可选:模板、资源

一个直观的类比

你可以把 Agent Skills 理解为AI 世界的"插件系统"

类比对象 Agent Skills
浏览器插件 给浏览器增加新功能
VS Code 扩展 给编辑器增加新功能
Agent Skills 给 AI Agent 增加新能力

不同之处在于:Agent Skills 是纯文本驱动的------不需要编译、不需要特殊 API,只需要写 Markdown 文件。

1.2 它解决了什么问题?

问题:AI Agent 能力有限

即便是最强大的 AI 模型,也有以下局限性:

  1. 知识有截止日期:不了解你公司内部的 API、流程和约定
  2. 缺乏领域专业知识:不知道你项目的特殊规范和最佳实践
  3. 没有项目上下文:不了解你团队的代码风格、架构决策和工具链

解决方案:用 Skills 扩展能力

Agent Skills 让你可以:

  • ✅ 教 Agent 使用你公司特定的工具和流程
  • ✅ 分享领域专业知识(如 PDF 处理、数据分析的最佳实践)
  • ✅ 创建可复用的任务模板
  • ✅ 在不同 Agent 平台之间共享技能(一次编写,到处使用)
graph LR subgraph 没有 Skills A["AI Agent"] -->|能力有限| B["只能用通用知识回答"] end subgraph 有了 Skills C["AI Agent"] -->|加载 Skill| D["PDF 处理技能"] C -->|加载 Skill| E["代码审查技能"] C -->|加载 Skill| F["数据分析技能"] D --> G["拥有专业能力"] E --> G F --> G end

1.3 Agent Skills 的特点

🔓 开放格式

  • 任何人都可以创建和分享 Skills
  • 不绑定特定的 AI 平台
  • Apache 2.0 开源许可

📝 简单直接

  • 核心只是 Markdown + YAML 的组合
  • 不需要编译或安装
  • 人可读、AI 可用

🔄 跨平台兼容

  • 支持 Claude Code、GitHub Copilot、VS Code、OpenAI Codex 等
  • 一次编写,多个平台可用

📦 可组合

  • Skills 是独立的文件夹,可以任意组合
  • 支持渐进式加载,不浪费上下文窗口
  • 可以通过 Git 版本管理

1.4 项目架构全貌

Agent Skills 项目包含三个主要部分:

graph TB subgraph "Agent Skills 项目" A["📋 格式规范
(Specification)"] B["📚 官方文档
(docs/)"] C["🐍 Python 参考库
(skills-ref/)"] end A -->|定义了| D["SKILL.md 文件格式"] A -->|定义了| E["目录结构约定"] A -->|定义了| F["命名规则和验证约束"] B -->|包含| G["入门教程"] B -->|包含| H["最佳实践"] B -->|包含| I["客户端集成指南"] C -->|提供| J["解析器 parser"] C -->|提供| K["验证器 validator"] C -->|提供| L["提示词生成 prompt"] C -->|提供| M["命令行工具 CLI"] style A fill:#4CAF50,color:#fff style B fill:#2196F3,color:#fff style C fill:#FF9800,color:#fff

三大组成部分

组件 路径 描述
格式规范 docs/specification.mdx 定义 SKILL.md 的完整格式
官方文档 docs/ 教程、最佳实践、集成指南
参考库 skills-ref/ Python 实现的解析、验证和工具库

1.5 一个 Skill 长什么样?

下面是一个最简单的 Skill 示例------一个掷骰子技能:

objectivec 复制代码
roll-dice/
└── SKILL.md

SKILL.md 的内容:

markdown 复制代码
---
name: roll-dice
description: Roll dice using a random number generator. Use when asked to roll a die (d6, d20, etc.).
---

To roll a die, use the following command:

```bash
echo $((RANDOM % <sides> + 1))
```

Replace `<sides>` with the number of sides on the die.

就是这么简单!这个文件包含:

  • Frontmatter--- 之间的部分):定义名称和描述
  • 正文--- 之后的部分):AI Agent 要遵循的指令

1.6 工作流程概览

当 AI Agent 使用 Skills 时,会经历以下三个阶段:

sequenceDiagram participant U as 用户 participant A as AI Agent participant S as Skill 文件 Note over A: 🔍 阶段一:发现(Discovery) A->>S: 扫描 Skills 目录 S-->>A: 返回每个 Skill 的 name + description Note over A: 只加载轻量元数据(~100 tokens/skill) U->>A: "帮我掷一个 D20" Note over A: ⚡ 阶段二:激活(Activation) A->>A: 匹配用户请求与 Skill 描述 A->>S: 读取 roll-dice/SKILL.md 完整内容 S-->>A: 返回完整指令(<5000 tokens) Note over A: 🚀 阶段三:执行(Execution) A->>A: 按照 SKILL.md 指令操作 A-->>U: "你掷出了 17!🎲"

这就是所谓的渐进式披露(Progressive Disclosure)------Agent 不会一次性加载所有 Skills 的完整内容,而是按需加载,保持上下文窗口高效利用。

1.7 谁在使用 Agent Skills?

Agent Skills 由 Anthropic 维护,但已被多个主流 AI 平台采纳:

  • Claude Code --- Anthropic 的 AI 编程工具
  • GitHub Copilot --- 在 VS Code 中使用
  • OpenAI Codex --- OpenAI 的编程 Agent
  • 以及更多正在接入的平台...

1.8 本章小结

要点 说明
Agent Skills 是什么 为 AI Agent 提供新能力的开放格式规范
核心文件 SKILL.md(YAML frontmatter + Markdown 指令)
关键机制 渐进式披露(发现 → 激活 → 执行)
跨平台 一次编写,多平台使用
项目组成 格式规范 + 官方文档 + Python 参考库

➡️ 下一章:核心概念 --- 深入理解渐进式披露、SKILL.md 文件格式等关键概念。

相关推荐
天空之城_tsf5 小时前
安装Claude
大模型·agent·claude
mCell11 小时前
【万字长文】从 AI SDK 到 mini-opencode:一次很巧的 Go Agent 架构实践
架构·go·agent
用户479492835691514 小时前
我开源了 Memex — 给 Claude Code 和 Codex 的本地会话搜索引擎
agent·claude
笨手笨脚の16 小时前
AI 基础概念
人工智能·大模型·prompt·agent·tool
用户479492835691518 小时前
所有人都在说 Harness Engineering,所以它到底是啥?
agent·ai编程
机器之心20 小时前
Sand.ai开源发布MagiCompiler:突破局部编译界限,定义训推性能上限
人工智能·openai
安思派Anspire20 小时前
安思派发布「OpenClaw实时联网搜索Skill」,让龙虾“睁眼看世界”!
aigc·openai·agent
wooyoo20 小时前
花了一周 vibe 了一个 OpenClaw 的 Agent 市场,聊聊过程中踩的坑
前端·后端·agent
树獭叔叔21 小时前
文本Embedding模型演进:从Encoder-only到LLM-based的技术变革
后端·aigc·openai