吴恩达讲Agent Skills

什么是 Agent Skills?

Agent Skills 是一种扩展智能体能力的模块化指令集合。通过技能,Claude 和其他 AI 智能体可以获得执行特定任务的新能力。

Skills 是文件夹形式的指令集合,用于扩展智能体的能力,赋予其专门的知识来执行任务。

  1. 一种轻量、开放的格式,用于扩展 AI agent 能力 | A lightweight, open format for extending AI agent capabilities
  2. 一个组织好的文件夹,由以下部分组成 | A folder of organized files consisting of:
  • 指令 | Instructions
  • 脚本 | Scripts
  • 资产与资源 | Assets and resources
  1. Skills 的核心特点
  • 开放标准:Skills 现在是一个开放标准,采用标准化格式,可与任何兼容的智能体产品配合使用
  • 一次构建,多处部署:你可以构建一次技能,然后在多个智能体产品中部署使用
  • 渐进式披露:技能的名称和描述始终存在于智能体的上下文窗口中,但只有当用户请求与技能描述匹配时,才会加载其余指令
  1. Skill 的最小结构
md 复制代码
my-skill/
└── SKILL.md   (唯一必需,包含说明和元数据)
md 复制代码
---
name: your-skill-name
description: What it does and when Claude should use it
---

# Skill Title

## Instructions
Clear, concrete, actionable rules.

## Examples
- Example usage 1
- Example usage 2

## Guidelines
- Guideline 1
- Guideline 2
  • 必填元数据:SKILL.md 开头的 YAML 块,需包含 name(名称)和 description(描述),启动时预加载至系统提示词

其他元数据:

Agent Skills 的工作原理

Agent Skills 的关键是渐进式披露,分三层加载:

  1. 层级 1:技能发现 -- AI 先读取所有技能的元数据(name 和 description),判断任务是否相关,这些元数据始终在系统提示中。
  2. 层级 2:加载核心指令 -- 如果相关,AI 自动读取 SKILL.md 的正文内容,获取详细指导。
  3. 层级 3:加载资源文件 -- 只在需要时读取额外文件(如脚本、示例),或通过工具执行脚本。

使用 Skills 所需的工具

智能体需要以下基本工具集来使用技能:

  • 文件系统访问:读取和写入文件
  • Bash 工具:执行代码

这些工具使智能体能够执行技能所需的任何命令。

Skills 的组合使用

智能体可以将 Skills 与 MCP 和 子智能体 结合,创建强大的智能工作流:

组合方式 说明
Skills + MCP 使用 MCP 从外部源获取数据,然后依靠技能来处理数据或高效检索数据
Skills + 子智能体 将任务委托给具有隔离上下文的子智能体,子智能体本身也可以使用技能获取专业知识

何时使用 Skills?

当你有一个反复要求智能体实现的工作流时,与其每次都解释相同的工作流,不如将其打包成一个技能,让智能体自动知道该做什么。

  1. 领域专业知识 | Domain Expertise
  • 品牌规范与模板 | Brand guidelines and templates
  • 法务审核流程 | Legal review processes
  • 数据分析方法论 | Data analysis methodologies
  1. 可重复的工作流程 | Repeatable Workflow
  • 每周营销活动复盘 | Weekly marketing campaign review
  • 客户电话准备流程 | Customer call prep workflow
  • 季度业务复盘 | Quarterly business review
  1. 新能力 | New Capabilities
  • 制作演示文稿 | Creating presentations
  • 生成 Excel 表或 PDF 报告 | Generating Excel sheets or PDF reports
  • 搭建 MCP 服务器 | Building MCP servers
如果没有skills会怎么样?
  1. 每次都要重新描述指令与需求 | Describe your instructions and requirements every time
  2. 每次都要重新打包参考资料与支持文件 | Bundle all your references and supporting files every time
  3. 难以保证流程或产出始终一致 | Ensure the workflow or outputs are always consistent

Skills vs MCP(模型上下文协议)

对比维度 MCP Skills
核心功能 连接智能体与外部系统和数据 定义可重复的工作流
数据来源 外部数据库等 利用 MCP 提供的工具和数据
使用场景 获取模型不知道的外部数据 教智能体如何处理这些数据
  • MCP 就像带来所有底层工具和资源的连接器
  • Skills 就像使用这些工具构建特定工作流的可重复流程 当利用外部数据计算指标、研究和计算数据时,所有底层工具和资源都可以通过 MCP 服务器外部提供

Skills vs Tools

想象你有一些工具:锤子、锯子和钉子。

你有一个技能:如何建造书架。

区别
Tools(工具) Skills(技能)
提供访问文件系统的方式 扩展智能体的能力,提供专业知识和指令
提供底层能力来生成、读取技能 引入需要执行的额外文件和脚本
支持文件编辑、执行代码、加载技能 创建可预测的工作流
重要特性
  • 工具定义(名称、描述、参数)始终存在于上下文窗口中
  • 技能是渐进式加载的,只在需要时加载
  • 如果某个工具不是每次对话都需要,通过仅在需要时加载可以节省大量 token

Skills vs Subagents

什么是Subagents?

Subagent是一种为执行单一、明确定义的任务而专门构建的特化AI Agent。它并非孤立工作,而是通常在一个Orchestrator(编排器)的协调下,与其他Subagent协同完成复杂的用户请求。

Subagents在多智能体系统中扮演着重要角色,它们通过专业化分工、独立上下文、可定制性和多种交互模式,提升了开发效率和代码质量

Subagents的工作方式

主智能体可以生成或创建Subagents,子代理可以向父智能体报告。这些子代理可以通过以下方式创建:

  • Claude Code
  • Agent SDK
  • 自定义实现
Subagents的价值
特性 说明
隔离上下文 提供独立的上下文环境
有限权限 限制工具使用权限
技能访问 每个子代理可以访问特定的技能
应用场景

主智能体可以作为编排器,利用所需的技能。子代理可以实现相同理念,使用特定技能。

示例:一个专门的代码审查子代理,其唯一任务是分析和审查代码库,并利用技能来指定你、你的团队或公司如何进行代码审查。

使用案例:客户洞察分析器

Agent 是整个架构的大脑与指挥中心,LLM 作为推理引擎,能够理解复杂指令、进行多步思考和决策规划;同时配备代码执行环境,支持动态调用工具和执行脚本。Agent 的主要职责是接收高层任务目标,将其拆解为可执行的子任务,协调下方的 Interview Analyzer 和 Survey Analyzer 两个子分析器并行工作,最后整合各分析器的输出结果,生成统一、结构化的客户洞察报告。Agent 还负责管理与多个 MCP 服务器的通信,确保数据流的顺畅传输。

Interview Analyzer & Survey Analyzer 是 Agent 的执行手臂;Interview Analyzer 专注于处理非结构化的客户访谈记录,运用自然语言理解技术提取关键观点、情感倾向和深层需求;Survey Analyzer 则针对结构化的问卷数据进行统计分析、模式识别和趋势归纳。这两个工具相互独立又可并行运行,各自接收 Agent 分配的任务后,调用 Filesystem 中的 Skills 和 LLM 能力进行深度处理,最终将结构化分析结果返回给 Agent 进行汇总。这种分工设计使得系统能够高效处理不同类型的数据源,同时保持模块化的可扩展性。

Filesystem 与 Skills 层构成了系统的能力基础设施;Filesystem 作为技能容器,封装了多个可复用的 Skill 模块,这些 Skill 是经过抽象的业务能力单元。左侧的指导文档("A guide for how to categorize feedback and how to summarize findings")作为元指令(Meta-prompt),定义了系统处理数据的标准方法论------包括分类维度、总结框架和质量标准。实现了"知识即配置"的理念:通过修改指导文档即可调整系统行为,无需改动底层代码,Skills 层向下为分析器提供标准化工具支持,向上为 Agent 提供可编排的能力单元,确保分析过程的一致性和可维护性。

MCP 服务器层是系统的外部连接关键,这一层包含三个 MCP 服务器:通用型的 MCP server 1 和 MCP server 3,以及专门对接云存储的 Google Drive MCP server,Agent 能够以统一的方式调用不同服务商的 API,无需关心底层接口差异;

工作流程
md 复制代码
主智能体(配备工具)
    ↓
通过 MCP 服务器获取工具
    ↓
分派子代理分析客户
    ↓
并行分析客户访谈和调查
    ↓
使用 Skills 进行可预测的分析
各组件作用
组件 作用
MCP 外部引入数据
子代理 并行化执行,在独立线程和上下文中运行
Skills 以可预测、可重复、可移植的方式消费所有信息

AI 生态系统组件对比表

组件 定义 特点
Prompts(提示词) 与模型通信的最原子单位 基础但不易扩展
Skills(技能) 通过代码和资源打包提示词和对话 可预测、可重复、可移植
Subagents(子代理) 被委派任务的独立智能体 可复用技能,隔离上下文
MCP 定义子代理使用的工具 按需加载必要数据

总结

参考文献

https://github.com/datawhalechina/agent-skills-with-anthropic

https://skillsmp.com/zh/docs

https://www.runoob.com/claude-code/claude-agent-skills.html

相关推荐
zhangshuang-peta9 小时前
人工智能代理团队在软件开发中的协同机制
人工智能·ai agent·mcp·peta
依米阳光0819 小时前
Playwright MCP AI实现自动化UI测试
ui·自动化·playwright·mcp
User_芊芊君子1 天前
HCCL高性能通信库编程指南:构建多卡并行训练系统
人工智能·游戏·ai·agent·测评
csdn_life181 天前
openclaw mcporter 操作 chome 在 window10/linux chrome-devtools-mcp
chrome·mcp·openclaw
爱喝白开水a1 天前
前端AI自动化测试:brower-use调研让大模型帮你做网页交互与测试
前端·人工智能·大模型·prompt·交互·agent·rag
落霞的思绪1 天前
GIS大模型RAG知识库
agent·rag
feasibility.1 天前
AI 编程助手进阶指南:从 Claude Code 到 OpenCode 的工程化经验总结
人工智能·经验分享·设计模式·自动化·agi·skills·opencode
香芋Yu1 天前
【LangChain1.0】第九篇 Agent 架构设计
langchain·agent·架构设计
斯普信专业组1 天前
构建基于MCP的MySQL智能运维平台:从开源服务端到交互式AI助手
运维·mysql·开源·mcp