入门级Agent Skill概念全解析,从原理到自制

摘要: 本文系统梳理Skill的核心概念、标准结构、底层原理、获取与评价方法、安装与触发方式、编写步骤及设计模式,帮助读者从零开始掌握这一模块化AI能力单元。本文基于B站视频撰写,由音视频转录工具Ai好记进行提炼核心观点、逐字文稿、思维导图,极大提升学习及写作效率。

目录

  • [1 Skill是什么](#1 Skill是什么)
  • [2 Skill的标准结构](#2 Skill的标准结构)
  • [3 Skill与系统提示词、MCP的区别](#3 Skill与系统提示词、MCP的区别)
  • [4 Skill的底层原理](#4 Skill的底层原理)
  • [5 Skill的获取与评价](#5 Skill的获取与评价)
  • [6 Skill的安装与触发](#6 Skill的安装与触发)
  • [7 从零编写Skill](#7 从零编写Skill)
  • [8 个人推荐Skill清单与参考资料](#8 个人推荐Skill清单与参考资料)

1 Skill是什么

2025年底,Agent Skill开放标准正式发布。到2026年5月,已有超过20款主流AI产品接入该标准,包括Claude Code、Codex等。花时间写好的Skill可以在这些平台上直接复用,不会被单一工具锁定。

从形态上看,最简单的Skill就是一份Markdown文档,可以用中文或英文编写。Skill的本质是围绕任务、工具、流程和输出边界的结构化行为设计,把复杂任务的触发条件、执行步骤、输入输出格式、禁止事项以及必要的脚本和参考资料,打包成一个可复用的技能包。

用一句话概括:Skill是AI的入职手册加工具箱

一个实际的生产流水线案例可以说明Skill的价值⬇️。MavContentFactory是一套端到端的内容创作Skill工作流,分为四个阶段:

  1. ResearchAgent:网络搜索调研,成果按固定格式写入文件
  2. SlideCraft:读取调研文件,将纯文字转为Markdown幻灯片
  3. PerFrame:将Markdown渲染为带动态效果和配音的视频
  4. ContentDistribution:多平台适配、生成封面、撰写文案

这套流水线中,Skill之间不通过对话记忆传递上下文,而是通过文件系统交接成果。每个中间文件都是明确定义的接口。即使AI服务中断或对话窗口关闭,三天后只要文件夹里还躺着最新的中间文件,流水线就能无缝接上。

2 Skill的标准结构

一个生产级Skill通常包含三个核心部分:

SKILL.md文件

这是Skill的大脑,决定了什么场景下唤醒AI,以及拿到任务后如何一步步执行。文件开头用YAML格式存放元信息,包括名称、描述、版本、触发条件等。正文是用自然语言写成的操作指南。核心指令必须精炼,AI对文本的理解能力有限,过于臃肿会导致执行质量下降。

REFERENCES文件夹

存放参考文件、输出案例、风格对照等辅助资料。AI在执行中按需查阅,不需要全部加载到上下文中。

SCRIPTS文件夹

存放AI可以直接运行的脚本。有了脚本,AI不需要过多思考,只要决定用哪个脚本直接执行即可,保证百分之百的执行正确率。

3 Skill与系统提示词、MCP的区别

这三者都涉及给AI下达指令,但定位完全不同。

系统提示词是全局常规设定,从对话开始到结束一直存在于底层上下文中。优点是覆盖面广,缺点是无法按需加载,项目规模上去后会越来越臃肿。

Skill是模块化的三层结构工具包,只在触发条件满足时才加载,执行完不会长期占用记忆窗口。可以在一个项目里装上十几二十个Skill,但AI一次只会加载需要的那一两个。

MCP解决的是我能连接什么外部资源的问题。

如果把MCP比作硬件驱动,Skill就是跑在驱动之上的软件。两者互补:没有MCP,Skill有想法但碰不到外部世界;没有Skill,MCP有能力但不知道怎么发挥。一个管能不能,一个管怎么做。

系统提示词适合放在贯穿所有任务的底层偏好里,Skill适合放特定任务的专业流程,MCP适合放连接外部世界的具体工具。三者各司其职,合理分工。

4 Skill的底层原理

Skill的底层原理可以概括为三大核心特性:

提供明确带约束的指令

Skill给大语言模型提供的是明确带有约束的指令,而不是模糊的意图。

渐进式披露

这是Skill最核心的机制。AI会先扫描Skill的元信息判断是否需要加载,触发后才加载完整的SKILL.md文档,执行中再按需查阅REFERENCES或调用SCRIPTS。这种分层加载方式极大节省了上下文Token。

条件触发

Skill可以通过直接调用触发,也可以通过关键词匹配自动触发。

正是由于这些特性,Skill极其节省Token:100个Skill大约只占5000个Token。对于100万Token的上下文窗口,一个Skill只占0.2%到0.4%的比例。但Skill正文控制在500到2000字是最佳范围,太短约束不足,太长稀释注意力。

5 Skill的获取与评价

获取途径

第一条是Skill官方市场,由Vercel出品,标准化程度高,支持一键安装。第二条是中文创作者社区,本土场景丰富但质量参差不齐。第三条是自己编写,最贴合个人实际工作流。

评价Skill好坏的五个标准

一是专注单一工作。二是具备交互性与可定制性,关键决策由用户做主。三是篇幅控制在500到2000字。四是有明确的边界条件与注意事项,敢于说不行的Skill比全能Skill更可靠。五是具备可组合性,输入输出格式定义清晰,能与其他Skill拼接成工作流。

6 Skill的安装与触发

安装

Skill安装分为三个层级:企业级、用户级、项目级。安装在项目级的Skill只在当前项目可用;安装在用户级的Skill在所有项目中生效。

安装方式有三种。第一种是手动安装:下载Skill后解压缩,在工作目录中创建.claude文件夹(或其他Agent对应的配置目录),再创建skills子文件夹,最后将Skill移入。第二种是PX命令一键安装:在终端执行npx skills add加Skill地址,系统会引导选择安装层级。第三种是AI辅助安装:将Skill仓库链接直接发给AI,告诉它下载到指定层级即可。

触发

第一种是输入斜杠加完整Skill名强制触发。第二种是用自然语言告诉AI要用Skill完成什么任务。第三种是AI根据任务类型自动判断并触发。

如果Skill没有成功调用,可能是因为没有放在正确的文件夹中,或者需要新开窗口重新加载。

7 从零编写Skill

五步法

第一步定位重复率最高的工作,回顾过去一周的工作记录,找到每天都要做、步骤基本不变的任务,从一个小痛点开始。第二步将隐性知识显性化,把直觉和经验写成AI能理解的步骤。第三步开启Plan模式协作,用优质案例做反向拆解,让AI读几份高质量作品总结规律。第四步跑通实测,写完先测试,不符合就调整措辞、补充约束、增加负面案例,一般需要3到5轮实测。第五步测试触发词,确保能被准确识别且不与其他Skill冲突。

四大原则

原则一:样例的说服力大于文字描述,给AI提供参考案例让它反向拆解。

原则二:一个Skill只专注一件事,遵循Unix管道哲学按需组合。原则三:让用户成为核心决策者,Skill是辅助工具不是替用户做决定。

原则四:固化真实的工作流,Skill来自真实业务场景而非凭空想象。

六大设计模式

检查清单型:将大任务拆成不可再细分的检查点逐一核对。

交互确认型:AI在关键决策点停下来给出多个备选方案,让用户参与决策。

文件流水线型:上一阶段输出作为下一阶段输入,靠文件连接防止对话中断。

反向拆解型:把高质量产品给AI让它反向推导步骤。

模板定制型:先定义输出框架再让AI填充内容。

工作流固化型:先手动跑通流程再让AI观察提炼成Skill。

8 推荐Skill清单

内容创作类

  • Sidecraft:生成演示文稿
  • Remotion:代码生成视频
  • Hyperframe:ML模型生成视频

开发类

  • CodeReview:代码审查
  • Skill-creator:创建其他Skill
  • ContentDistribute:前端界面配置
  • SideCraft:开发效率套件

工具与效率类

  • Find Skills:搜索Skill
  • GriMe:模拟严苛问答检验思路
  • Caveman:无损压缩输出Token

Skill最适合从最小最具体的任务开始,像打磨工具一样:跑一遍、改一版,再跑一遍、再改一版,逐步迭代出来。越早开始积累,复利效果越明显。工具可能会过时,但沉淀下来的流程不会过时。

参考资料

  • 基于B站视频@没token的Mav《20分钟让你成为skill专家:从原理到自制》核心观点及步骤,由Ai好记进行视频解析后根据导图大纲进行撰写。如果大家也有通过音视频学习的习惯,可以试试先用Ai好记转成图文笔记,结合精华速览深度学习,亲测省时省力!