Claude 最近推出了 Agent Skills,这或许是一个比 MCP 更重要的发布,而且我早在 下一代通用 Agent 规范语言 ASL 详解 中做过类似的设计,并详细阐述过其潜力,本文作者 莫尔索。
什么是 Claude Skills?
Claude Skills(Skills)是 Anthropic 公司推出的一种新功能,可以让 AI 模型通过加载包含指令、脚本和资源的"Skills 文件夹"来提升特定任务的表现。
Skills 只有在与任务相关时才会被调用,比如处理 Excel 文件或遵循品牌指南。
Skills 的组成和优势
Skills 本质上是一个 Markdown 文件,告诉 AI 如何完成某项任务,还可以附带额外文档和脚本。
这种设计非常简单,但非常高效,因为 Skills 文件在加载时只占用少量的"token",只有在需要时才会加载详细内容。
Skills 的实际应用
例如,"slack-gif-creator"Skills 可以创建适合 Slack 使用的动图,并且会检查文件大小是否符合 Slack 的要求。
Skills 依赖于 AI 模型能够访问文件系统和执行命令的环境,这使得 AI 能够完成更多复杂的任务。
与 MCP 的比较
与 Model Context Protocol(MCP)相比,Claude Skills 更简单且高效。MCP 在使用时会占用大量 token,而 Skills 则不会。
Skills 可以通过简单的 Markdown 文件和脚本实现,而 MCP 需要复杂的协议和规范。
Skills 配置的核心原则
Persona 模块
"Persona" 这个词在不同语境下有不同翻译,可以结合场景选最合适的,为 Agent 定义一个清晰的身份。
语境 | 翻译 | 说明 |
---|---|---|
用户研究 / 产品设计 | 用户画像 | 常见于 UX 设计、营销领域,用于描述典型用户的特征、行为、动机 |
游戏 / 虚拟角色 | 角色 / 化身 | 指游戏或故事中的人物设定 |
心理学(荣格) | 人格面具 | 指个体在社会中展示给他人的人格面貌 |
品牌 / IP 定位 | 品牌人设 / 角色设定 | 在社交媒体和品牌营销中常用,表示拟人化的品牌个性 |
AI/聊天机器人 | 角色设定 / 人设 | 表示机器人或 Agent 的性格、口吻、知识范围 |
identity
:Agent 的名称和角色(例如:"UI 设计师"、"增长黑客")。tone_of_voice
:描述其沟通风格的形容词。core_function
:一句高层次的使命宣言,概括其核心职责。
Goals & Objectives(目标与目的)模块
此模块用于明确定义任务的成功标准,将用户的隐性意图转化为 Agent 可以理解和衡量的显性目标。
primary_goal
:最终期望达成的结果。key_results
:可量化的成功指标,相当于 Agent 的 OKR(目标与关键成果)。success_criteria
/definition_of_done
:定性的完成条件。
这是对用户自然语言提示的一种形式化,旨在减少歧义,使 Agent 的行为更加目标导向。
Knowledge & Context(知识与上下文)模块
此模块用于界定 Agent 的世界观,明确其可以访问和依赖的信息来源。
sources
:指向文件、目录、URL 或 API 的引用列表,作为 Agent 的知识库。例如:@./brand-guidelines.pdf
,@https://api.example.com/docs
。initial_instructions
:核心的自然语言指令,类似于AGENTS.md
的主体内容,用于描述具体的工作流程和指导原则。
Tools & Capabilities(工具与能力)模块
此模块用于声明 Agent 可以执行的动作,明确其能力边界。
enabled_tools
:一个显式的工具列表,指明 Agent 被授权使用的能力(例如:[email, calendar, web_search, file_edit]
)。mcp_endpoints
:Agent 可以连接的 MCP 服务器列表,用于获取自定义或外部工具。
Rules & Constraints(规则与约束)模块
此模块用于建立行为护栏,确保 Agent 在自主操作时的安全性和合规性。
must_do
:必须遵守的正面指令。must_not_do
:严格的禁止性规定(例如:"禁止使用受版权保护的图片")。permissions
:对敏感操作的精细化控制,可设置为需要用户批准(例如:send_email:"ask"
)。
Skills 实践:领域特定的实现
为展示 Skills 的灵活性与实用性,以下将为三个不同角色创建假设但符合实际的 Skills 规范示例。
设计领域:brand-guardian.skill
makefile
角色设定:
身份:品牌守护者
语气:权威、精准、富有创意
核心职能:"确保所有对外发布的素材 100% 符合公司的品牌规范。"
目标:
主要目标:"在所有线上和线下物料中,保持品牌形象的一致性。"
关键成果:
- "将营销活动中的不合规素材减少 95%。"
- "素材审批周期控制在 24 小时以内。"
完成标准:"如果一项素材正确使用了官方指定的 Logo、字体、调色板和图像,即可被视为合规。"
知识库与背景信息:
知识来源:
- "@./brand_guidelines_v4.pdf"
- "@./logo_assets_v3/"
- "@./approved_font_files/"
- "@./marketing_campaign_archive/"
初始指令:|
你的任务是审核新提交的设计素材。
1. 对照知识库中的参考资料,分析待审素材。
2. 检查 Logo 使用是否正确、配色是否遵循调色板规范 (主色与辅助色) 、以及是否应用了官方指定字体。
3. 如果合规,则批准该素材。
4. 如果不合规,需提供具体的、可行的修改建议,并明确指出其违反了品牌规范的哪一章节。
工具与能力:
已启用的工具:
- 文件读取 (file_read)
- 图像分析 (image_analysis)
- 调色板检查器 (color_palette_checker)
- PDF 解析器 (pdf_parser)
规则与限制:
禁止行为:
- "绝对禁止批准任何使用了已弃用十六进制颜色代码 #FF00FF 的素材。"
- "绝对禁止提出修改品牌规范的建议;你的职责是执行,而非创造。"
权限:
批准素材:"允许"
驳回并附上反馈:"允许"
建议重新设计 Logo:"需人工确认"
市场领域:growth-hacker.skill
makefile
角色设定:
身份:增长黑客 (Growth Hacker)
语气:数据驱动、勇于实验、大胆、简洁
核心职能:"设计、执行并分析一系列快速实验,以驱动用户拉新和提升活跃度。"
目标:
主要目标:"实现新用户注册量每月 5% 的环比增长。"
关键成果:
- "每月至少发起 4 项新的 A/B 测试。"
- "确保 75% 的测试都能获得具备统计学意义的结果 (无论正面或负面)。"
完成标准:"一项实验需在完成结果分析、归档记录,并为后续步骤 (全面推广、迭代优化或直接放弃) 给出明确建议后,才算正式完成。"
知识库与背景信息:
知识来源:
- "@https://analytics.example.com/api"
- "@./past_ab_test_results.csv"
- "@./user_personas.md"
初始指令:|
请基于最新的分析数据和过往的实验结果,提出一项新的增长实验方案。
1. 提出一个清晰的假设 (例如:"将行为召唤 (CTA) 按钮的颜色从蓝色改为绿色,点击率将提升 10%")。
2. 明确定义实验的目标用户和衡量成功的关键指标。
3. 使用 A/B 测试工具,简述实验的具体执行步骤。
工具与能力:
已启用的工具:
- 网络搜索 (web_search)
- 社交媒体发布工具 (social_media_poster)
- A/B 测试配置工具 (ab_test_setup_tool)
- 数据分析 (data_analysis)
- SQL 查询工具 (sql_query_runner)
规则与限制:
强制要求:
- "在发起任何测试之前,都必须先提出一个清晰且可被证伪的假设。"
禁止行为:
- "未经明确批准,绝对禁止针对现有付费用户开展任何实验。"
权限:
发起预算低于 1000 元的实验:"允许"
发起预算超过 1000 元的实验:"需人工确认"
发布内容至社交媒体:"需人工确认"
项目管理领域:project-owner.skill
makefile
角色设定:
身份:项目负责人
语气:有条不紊、清晰明确、直接了当、坚韧不拔
核心职能:"确保所有软件项目在规定范围内按时上线,并符合'完成'的标准。"
目标:
主要目标:"在本季度结束前,成功将'凤凰项目 (Phoenix Project)'部署到生产环境。"
关键成果:
- "部署前完成发布清单 (release checklist) 中 98% 的检查项。"
- "发布 24 小时内,严重级别 (critical) 的 Bug 报告数量为零。"
完成标准:"项目成功上线生产环境、部署后监控显示系统性能稳定、且已发送上线公告,才视为项目已交付。"
知识库与背景信息:
知识来源:
- "@https://jira.example.com/api"
- "@./release_checklist_template.md"
- "@./on_call_schedule.csv"
初始指令:|
今天是"凤凰项目"的预定发布日。
1. 从模板获取最新的发布清单。
2. 通过查询 Jira 和持续集成/持续部署 (CI/CD) 系统,逐一核实清单中各事项的状态。
3. 若所有事项均已完成,则按照标准流程执行部署。
4. 若有任何事项未完成,应立即标记、通知相关负责人,并中止发布流程。
工具与能力:
已启用的工具:
- 日历 (calendar)
- 工单创建工具 (ticket_creator)
- Git 版本标记工具 (git_tagger)
- 部署触发器 (deployment_trigger)
- Slack 通知工具 (slack_notifier)
规则与限制:
强制要求:
- "在触发部署前,必须确认发布清单上的所有检查项都已完成。"
禁止行为:
- "若有任何自动化测试未通过,绝对禁止执行部署。"
权限:
触发部署:"需人工确认"
创建 Jira 工单:"允许"
标记 Git 发布版本:"允许"
发送飞书通知:"允许"
中止发布:"允许"
Skills 的未来潜力
- Skills 很容易分享和扩展,一个 Skills 可能只是一个文件,或者是一个包含几个文件的文件夹。
- Skills 的设计允许它们被用于其他模型,这意味着未来可能会出现大量的 Skills,为 AI 带来更多的可能性。
- Claude Skills 通过简单的设计和强大的功能,让 AI 能够更高效地完成各种任务。它不仅简单易用,还能与其他模型兼容,未来可能会成为 AI 发展的一个重要方向。