从“会回答”到“会干活”，Agent Skills 重构 AI 智能体的做事逻辑

如果你最近正在折腾AI Agent，大概率会遇到这样一系列让人头疼的问题：明明选用的模型已经足够聪明，输出结果却时好时坏，稳定性极差；为了追求理想效果，Prompt越写越长，可最终呈现的效果却越来越玄学，有时候改一个标点符号都会引发连锁反应；好不容易接入了MCP工具、打通了各类外部接口，AI Agent依旧像个"摸不着门道的新手"，不知道该如何专业地完成一件具体的事。

如果你也被这些问题困扰，先别着急否定模型性能，也不用怀疑工具本身的实用性。其实问题的核心不在于这些外部条件，而在于AI Agent本身缺少了最关键的一环------"做事方法"。而这，正是Agent Skills应运而生的核心原因。在AI Agent从"能对话"向"能干活"进化的过程中，Agent Skills不是可有可无的补充，而是决定其能否真正落地实用的核心支撑。

今天我们就来好好聊聊Agent Skills，从本质定义到实际应用，从核心价值到实战案例，帮你彻底搞懂这个让AI Agent"脱胎换骨"的关键能力，以及如何利用它让智能体真正成为能独当一面的"专业员工"。

首先先给大家一个明确的结论：到底什么是Agent Skills？用一句话就能讲清楚，Agent Skills是一套"教Agent怎么做事"的标准化技能说明书。它既不是我们平时写的Prompt，也不是用来拓展能力的Tool，而是介于两者之上的一层关键架构。它有着明确的使用场景、固定的执行流程、稳定的输出标准，而且能够长期复用、进行版本化管理。如果用一个通俗的比喻来理解，Agent Skills就像是给AI Agent配备的一本"岗位技能手册"，不是临时交代某一次任务的具体要求，而是明确告知它"只要遇到这类事，你就应该一直按照这个标准流程来做"。

可能有朋友会疑惑，之前用Prompt+Tool的组合也能完成不少任务，为什么现在突然需要Agent Skills了？这就需要我们先搞清楚，Prompt和Tool各自的能力边界在哪里，它们到底哪些地方已经满足不了AI Agent的进阶需求了。

先说说Prompt的天然问题。Prompt最大的问题从来都不是"不好写"，而是它的"一次性属性"和"不可控性"。首先，Prompt是一次性的上下文信息，用过之后就会消失，下次遇到类似的任务，还得重新撰写或者调整；其次，Prompt很难复用，更没办法进行版本管理，比如你之前写过一个效果不错的文案生成Prompt，过了一段时间再用，可能因为模型版本更新或者任务细节变化，就需要重新修改，而且没办法追溯之前的修改记录；最后，当多个Prompt组合使用时，极易出现互相干扰的情况，比如一个负责逻辑梳理的Prompt和一个负责语言润色的Prompt叠加，很可能导致智能体既没理清逻辑，也没润色好语言。

更核心的是，Prompt解决的只是"这一轮你该怎么回答"的问题，却没办法解决"以后遇到类似问题，你应该一直怎么做"的长期问题。它更像是给智能体的"临时指令"，而不是"长期准则"。比如你让智能体写一篇产品推广文案，用Prompt可以告诉它这次要突出什么卖点、用什么风格，但下次换一个产品，或者换一种推广渠道，你还是得重新写Prompt，智能体没办法从之前的经验中提炼出通用的文案撰写方法。

再看Tool和MCP的能力边界。我们都知道，Tool的作用是拓展AI Agent的能力范围，解决"能做什么"的问题，比如通过翻译工具让智能体具备多语言翻译能力，通过数据分析工具让它能处理复杂数据；MCP则是解决"怎么接入外部能力"的问题，把API、数据库、文件系统等各类外部资源打通，让智能体能够调用更多外部服务。但无论是Tool还是MCP，都存在一个致命的短板：它们不负责规定"事情应该按什么流程来做"。就像给了你一套齐全的工具箱，也教会了你怎么使用每一件工具，但并没有告诉你用这些工具组装一个家具的具体步骤，你可能知道用锤子、螺丝刀，但不知道先装哪个部件、再拧哪个螺丝，最终还是组装不出合格的家具。

而Agent Skills恰恰补上了这关键的一层。它解决的是AI Agent长期、稳定、可复用的"做事方法论"问题。我们可以用一句话总结Prompt、Tool/MCP和Agent Skills的分工：Prompt解决"这一轮怎么说"，Tool/MCP解决"能干什么"，Agent Skills解决"长期应该怎么干"。三者相辅相成，才能让AI Agent真正具备稳定的做事能力。

搞懂了Agent Skills的核心价值，接下来我们再看看它具体长什么样。从官方规范来看，一个完整的Agent Skill至少是一个独立的文件夹，里面包含了多个关键文件，不同文件有着不同的功能定位。具体的文件结构如下：skill-name/目录下，包含SKILL.md、FORMS.md、reference.md、examples.md这四个核心文档，以及一个scripts文件夹，scripts文件夹里又包含了analyze_form.py、fill_form.py、validate.py等实用脚本。

在这些文件中，SKILL.md无疑是整个Agent Skill的灵魂所在。它定义的不是简单的"回答格式"，而是一整套可执行的行为流程。接下来我们就重点说说SKILL.md的官方模板，这是我们创建自己的Agent Skill的基础。

首先是官方提供的最小可用模板，结构非常简洁明了：开头用---分隔，标注出skill的名称（name）和简要说明（description），然后分三个核心部分展开，分别是"使用场景""执行步骤"和"输出要求"。"使用场景"明确说明在什么情况下应该使用这个Skill；"执行步骤"详细列出完成任务的具体流程，包括异常情况如何处理；"输出要求"则明确最终输出的格式或必须包含的内容。这个最小模板本身就充分体现了Agent Skills的核心思想：不是告诉模型"怎么回答"，而是规定"事情要怎么做"。

而在实际应用中，我更推荐大家使用一套更完整的实战模板，这个模板能让Agent Skill的逻辑更清晰、实用性更强。实战模板在最小模板的基础上，增加了"技能目标""输入说明"和"注意事项"三个关键部分，还补充了metadata元数据，用于标注skill的版本、作者等信息。具体来看，"技能目标"明确这个Skill希望Agent达成的核心目标；"输入说明"详细列出支持的输入类型和必须包含的字段，避免因输入信息不完整导致Skill无法正常执行；"执行流程"相比最小模板的"执行步骤"更具逻辑性，通常包括数据识别、关键字段提取、逻辑判断、输出结论等环节；"输出格式"则更具体，比如在安全日志分析Skill中，明确要求输出"是否异常""判断依据""风险说明""建议动作"四个核心部分；"注意事项"则用于规避常见问题，比如"无法确认时必须说明不确定性""禁止空泛总结"等。

这里给大家举一个实战模板的具体例子，比如一个"安全日志分析Skill"的SKILL.md内容：开头标注name为security-log-analysis，description为"对安全日志进行结构化分析，判断是否存在异常行为"，metadata标注版本为1.0、作者为ailot；然后依次展开"技能目标"（准确识别安全日志中的异常行为，为安全防护提供决策依据）、"输入说明"（支持的输入类型为文本格式的安全日志，必须包含时间戳、操作主体、操作行为、操作结果等字段）、"执行流程"（1. 识别数据类型，判断是否为有效安全日志；2. 提取时间戳、操作主体等关键字段；3. 根据预设规则进行逻辑判断；4. 输出分析结论）、"输出格式"（分点列出是否异常、判断依据、风险说明、建议动作）、"注意事项"（无法确认时必须说明不确定性，禁止空泛总结）。通过这样的模板，Agent就能清晰地知道每一步该做什么、该输出什么。

除了明确的结构，Agent Skills还有一个非常大的优势------特别省Token。这得益于它采用的渐进式加载机制。具体来说，Agent启动时，只加载SKILL.md中的name和description部分，这部分内容非常简洁，占用的Token极少；当Agent判断当前任务需要匹配这个Skill时，才会加载完整的SKILL.md；而在执行过程中，再根据实际需求按需加载scripts文件夹中的脚本或其他参考文档。这种加载方式带来的好处非常明显：既不会污染上下文，也不会浪费Token，同时还能让Agent更容易选对适合当前任务的技能，提升执行效率。

很多朋友可能还会混淆Agent Skills和MCP的关系，这里我们再用一个清晰的对比来区分两者。从关注点来看，Agent Skills关注的是"做事方法"，而MCP关注的是"外部能力"；从本质来看，Agent Skills是行为与决策规范，MCP是API、数据、系统等外部资源的接入载体；从是否直接执行来看，Agent Skills不直接执行任务，而是指导任务执行流程，MCP则直接执行外部能力调用。用一个更通俗的比喻来说，MCP就像是一个装满各种工具的工具箱，而Agent Skills就是这些工具的使用说明书，告诉你在什么情况下用什么工具、按什么步骤使用。

搞懂了这些基础概念，接下来就是大家最关心的实操部分：在OpenCode中如何配置和使用Agent Skill？这部分内容比较关键，大家可以重点记一下。

首先是Skill的存放位置，OpenCode会自动扫描三个目录，分别是项目级、全局级和兼容目录。其中项目级目录是最推荐的，路径为.opencode/skill//SKILL.md，这个目录下的Skill只适用于当前项目，不会影响其他项目；全局级目录路径为~/.config/opencode/skill//SKILL.md，这个目录下的Skill可以在所有项目中复用；兼容目录路径为.claude/skills//SKILL.md，主要用于兼容旧版本的Skill。

其次是Skill的规范要求，这几点一定要严格遵守，否则Skill可能无法正常生效。第一，文件名必须是SKILL.md，不能随意修改为其他名称；第二，SKILL.md中定义的name必须全部小写，并且要和所在的目录名完全一致，这是最常见的坑，很多朋友创建的Skill失效，就是因为name和目录名不一致；第三，SKILL.md中必须包含description字段，简要说明Skill的用途和适用场景，否则Agent无法判断该Skill的适用范围。

另外，OpenCode还支持Skill的权限控制，我们可以在opencode.json文件中进行配置，精确控制哪些Skill能被Agent使用。权限分为三种类型：允许（allow）、拒绝（deny）和询问（ask）。允许权限表示技能可以立即加载使用；拒绝权限表示技能对智能体隐藏，访问请求会被直接驳回；询问权限表示加载技能前会向用户请求批准。同时，权限配置还支持通配符，比如"experimental-"可以匹配所有以"experimental-"开头的Skill，方便我们对一类Skill进行批量权限控制。比如在配置文件中写入"permission": {"skill": {"pr-review": "allow", "experimental- ": "ask", "internal-": "deny", "": "allow"}}，就表示pr-review技能允许直接使用，所有实验性技能加载前需要询问用户，所有内部技能拒绝使用，其他技能默认允许使用。

理论知识讲完了，接下来给大家分享三个完整的Agent Skills实战案例，这些案例都是经过实际验证的，实用性很强，大家可以直接参考使用，或者根据自己的需求进行修改。

第一个案例是"能生成Skills的Skill"，这是官方提供的一个非常实用的Skill，相当于"Skill的生成器"，能帮我们快速创建新的Skill，极大提升效率。这个Skill的安装方法很简单，以OpenCode为例，我们只需要把对应的提示词发给AI即可，它的官方地址是https://github.com/anthropics/skills/tree/main/skills/skill-creator，大家可以直接去GitHub上查看详细的使用说明。另外，国产的IFLOW平台也有类似的功能，它直接把各类Skills整合到了在线技能市场中，我们不需要手动配置文件，直接在市场中选择想要的技能，点击安装就能使用，操作更加便捷。比如我们想要创建一个文案生成Skill，只需要在技能市场中找到"Skill生成器"，输入"创建一个产品推广文案生成Skill，要求突出产品卖点、语言风格活泼"，它就能自动生成完整的SKILL.md文件和相关脚本，非常省心。

第二个案例是"代码审查Skill"。对于程序员来说，代码审查是日常工作中非常重要的一环，但人工审查不仅耗时耗力，还容易遗漏一些潜在问题。这个Skill就能让AI Agent自动完成代码审查工作，从结构、命名、边界条件、安全性四个核心维度进行系统性检查，并且明确指出问题所在，给出可执行的修改建议。创建这个Skill时，我们需要在SKILL.md中明确"技能目标"（对代码进行结构、可读性和潜在风险的系统性审查，辅助开发人员提升代码质量）、"输入说明"（支持的输入类型为各类编程语言的代码片段，必须包含完整的代码上下文）、"执行流程"（1. 识别代码的编程语言和核心功能；2. 从结构维度检查代码的模块化程度、逻辑连贯性；3. 从命名维度检查变量名、函数名的规范性和可读性；4. 从边界条件维度检查是否考虑了异常输入、极限场景；5. 从安全性维度检查是否存在漏洞，比如SQL注入、XSS攻击等；6. 汇总检查结果，给出具体修改建议）、"输出格式"（分点列出问题类型、问题位置、问题描述、修改建议，问题与建议一一对应）、"注意事项"（只针对代码本身进行审查，不涉及业务逻辑合理性；对于不确定的问题，明确标注"待确认"，不随意下结论）。创建完成后，我们只需要把需要审查的代码发给AI Agent，它就会自动调用这个Skill，完成系统性审查并输出详细报告，极大提升代码审查效率。

第三个案例是"百度热点数据抓取Skill"。在日常工作和生活中，我们经常需要关注各类热点信息，手动抓取不仅繁琐，还容易遗漏重要内容。这个Skill就能让AI Agent自动抓取当天的百度热点信息，并进行结构化整理。创建这个Skill时，我们需要在SKILL.md中明确"技能目标"（自动抓取当天百度热点信息，进行结构化整理，方便用户快速了解热点动态）、"输入说明"（无需额外输入，默认抓取当天热点；若需要抓取指定日期的热点，可输入具体日期）、"执行流程"（1. 调用浏览器工具，访问百度热点首页；2. 解析页面内容，提取热点标题、热度值、热点摘要、发布时间等关键信息；3. 过滤广告信息和无效内容；4. 对热点信息进行排序，按热度值从高到低排列；5. 生成结构化的热点报告）、"输出格式"（分点列出热点排名、热点标题、热度值、热点摘要、发布时间）、"注意事项"（若页面结构发生变化导致抓取失败，明确提示"抓取失败，原因：页面结构变更"；对于无法确定是否为广告的内容，标注"疑似广告"）。同时，在scripts文件夹中创建对应的抓取脚本（fill_form.py）和验证脚本（validate.py），分别用于实现数据抓取和内容验证功能。测试时，我们只需要输入提示词"帮我抓取今天百度的热点信息"，AI Agent就会调用这个Skill，自动完成抓取和整理工作。从实际测试效果来看，虽然偶尔会夹杂两条广告信息，但整体内容准确完整，能够满足日常热点关注需求。

除了自己创建Skill，我们还可以充分利用官方提供的资源和生态，快速获取成熟的Skill，避免重复造轮子。这里给大家推荐几个常用的官方资源：

第一个是Agent Skills官方规范，地址是https://agentskills.io/home，这里详细介绍了Agent Skills的核心定义、设计理念、规范要求等基础内容，是学习Agent Skills的官方权威资料，适合新手入门学习。

第二个是SkillsMP（Agent Skills市场），地址是https://skillsmp.com，这是一个专门的Agent Skills分享平台，在这个平台上，我们可以看到其他开发者分享的各类Skill，学习他们的创作思路和设计方法；同时，也可以直接复用平台上的成熟Skill，只需要根据自己的需求进行简单修改就能使用；此外，我们还可以把自己创建的Skill分享到平台上，和其他开发者交流互动，快速建立自己的技能库。

第三个是官方文档，包括入门指南（https://code.claude.com/docs/zh-CN/skills）和概览（https://platform.claude.com/docs/zh-CN/agents-and-tools/agent-skills/overview），入门指南详细介绍了Agent Skills的基本使用方法和配置步骤，概览则从更高维度解读了Agent Skills在AI Agent生态中的定位和价值，适合不同阶段的学习者参考。

第四个是官方开源的Skill库，地址是https://github.com/anthropics/skills，这里包含了官方开发的各类实用Skill，比如我们之前提到的"Skill生成器"就出自这里。这些开源Skill的代码质量很高，结构规范，是我们学习创建Skill的绝佳参考案例，大家可以直接下载查看，甚至可以基于这些开源Skill进行二次开发，打造适合自己的专属Skill。

最后，我们用一句话总结一下今天的核心内容：Agent Skills不是让模型变得更聪明，而是让AI Agent更像一个"真正会干活的专业员工"。它给智能体提供的不是临时的指令，而是长期稳定的做事方法论，让智能体在面对各类任务时，都能按照规范的流程输出稳定的结果。

如果你已经在做AI Agent相关的工作，不妨从一个最小的Skill开始，把你最常用、最稳定的一段Prompt升级成真正的Agent Skill。在这个过程中，你会发现AI Agent的执行效率和稳定性会得到显著提升。

最后想跟大家说的是，Agent Skills就像是AI Agent的"武功秘籍"，不同的Skill对应不同的"武功招式"，而真正好用的Skill，一定是适合自己需求的。大家可以多尝试、多实践，结合自己的业务场景创建专属的Skill，让AI Agent真正成为自己工作中的得力助手。毕竟，兵器终究要自己用着顺手，适合自己的，才是最好的。