为什么 AI 巨头们放弃私有壁垒,争相拥抱 Agent Skills

编者按: 在 AI 智能体赛道竞争白热化的今天,为何巨头们会突然放弃私有壁垒,共同拥抱同一套技术标准?

我们今天为大家带来的文章,作者的观点是:Agent Skills 之所以能在 90 天内从私有功能演变为行业标准,关键在于其"渐进式披露"的架构设计解决了 Token 经济学痛点,以及"一次编写,处处运行"的可移植性打破了平台壁垒。

文章详细回顾了 2025 年 10 月至 12 月间,Anthropic 如何通过简单的 Markdown 文件格式推出 Agent Skills,并迅速获得 OpenAI 和 Microsoft 的跟进支持。文中深入剖析了技能加载的"渐进式披露"机制如何大幅降低 Token 消耗,对比了其与微调、Custom Instructions 等方案的优劣,并展示了开发者生态在三周内从 0 爆发至 25,000 个技能的惊人增长。此外,文章还探讨了巨头背后的战略博弈,以及企业应如何布局技能治理与基础设施。

标准化往往是生态成熟的前奏,当定制 AI 能力不再受制于平台锁定时,真正的智能体应用规模化落地才刚刚开始。

作者 | Han HELOIR YAN, Ph.D.

编译 | 岳扬

2025 年 12 月 18 日,AI 行业发生了一件不同寻常的事:OpenAI 宣布将采用由其主要竞争对手 Anthropic 制定的一项标准。短短几小时内,Microsoft 也迅速跟进,把同样的技术标准格式集成到了 GitHub Copilot 和 VS Code 中。而 Google 其实早在两个月前就已推出了类似的系统。到那周结束时,一个开源社区平台上已经列出了超过 25,000 个该新标准的实现方案。

这并非一次新模型的发布。没有基准测试排行榜上的刷分大战,也没有"碾压 GPT-5"之类的标题党新闻。这是一件更具深远意义的事件:一种用于教会 AI 智能体执行专业工作流的通用格式正式诞生。Anthropic 将其称为"Agent Skills",而在 2025 年 10 月到 12 月这 90 天里,这项技术迅速从一项私有功能演变为事实上的行业标准。

这件事的关键在于:为什么一家并没有最强模型的公司,却能主导整个行业定制 AI 的方式?如果你正在构建 AI 智能体、交付 AI 驱动的产品,或是设计未来需要对接多家 AI 服务供应商的系统架构,那么这件事的重要性,远超过你今年能看到的任何一次基准测试分数提升。

01 2025 年 10 月 16 日:低调发布

Anthropic 于 2025 年 10 月 16 日面向 Claude 用户推出了 Agent Skills 功能。官方公告言简意赅: "Skills 就是一个包含指令、脚本和资源文件的文件夹,Claude 可以在需要时加载它们。"

其技术架构刻意保持简单。每个 Skill 对应一个目录,其中必须包含一个 SKILL.md 文件,该文件采用 YAML 前置元数据与 Markdown 指令说明相结合的格式。

真正的创新在于其加载机制。 启动时,Claude 会扫描所有可用的 Skills,但只将它们的元数据(Skill 名称和 Skill 描述)加载到系统提示词中。这些元数据相当于一个索引目录,每个 Skill 大约消耗 30--50 个 token。当用户请求匹配到某个 Skill 的应用领域时,Claude 才会通过文件系统访问加载完整的指令内容。假如一个代码库中有 100 个 Skills,那么初始只需约 5,000 个 token 存储元数据,而每个 Skill 的完整内容(通常 2,000--5,000 个 token)仅在真正需要时才加载。

Anthropic 在工程博客中将这种设计称为 "渐进式披露"(progressive disclosure) 。这一模式借鉴自信息架构领域,核心思想是只在必要时才引入复杂内容。对 AI 智能体而言,它解决了一个实际痛点:如何让智能体访问大量程序性知识,又不至于在开始工作前就耗尽上下文窗口?

开发者兼 AI 研究员 Simon Willison 在 10 月 16 日写道:"Skills 的概念极其简单:一个 Skill 就是一个 Markdown 文件,告诉模型如何完成某项任务,还可以附带额外文档和预先写好的脚本。关于 Skills 的设计,有一点我非常喜欢,它没有任何限制阻止这些 Skills 被其他模型使用。"

他预测道:"我预计我们将看到 Skills 的寒武纪大爆发,相比之下,今年的 MCP 热潮都会显得平淡无奇。"

最初的反响积极但较为克制。GitHub 上的 anthropic/skills 仓库起初只包含 Anthropic 提供的一个示例:用于为 DOCX、PPTX、XLSX 和 PDF 文档创建 Skills。这些并不是仅供演示的简单示例,它们正是 Claude 在生产环境中驱动文档生成功能所使用的 Skills。

02 11 月:悄然增长阶段

在 11 月期间,有趣的事情发生了。开发者们在没有营销推动或激励计划的情况下,开始自发地构建 Skills。Skills 仓库的示例数量增长到 50 多个,覆盖创意设计、技术开发和企业沟通等多个领域。

早期的企业试点项目陆续出现。云内容管理公司 Box 构建的 Skills,能将存储的文件自动转换为符合组织标准的格式化文档。日本电商巨头 Rakuten 部署了用于财务操作的 Skills,此前这类操作需要跨部门人工协调。Canva 则集成了用于品牌合规设计工作流的 Skills。

通过实际使用,Skills 在 token 效率方面的优势逐渐显现。GitHub MCP server 是一种比较流行的将 AI 智能体连接到 GitHub 仓库的方式,仅其工具定义和上下文就消耗约 15,000--30,000 个 tokens。而一个提供类似 GitHub 工作流指导的 Skill,元数据仅需 50 个 tokens,完整加载时也只需 3,000--4,000 个 tokens,token 效率提升了 5--10 倍。

更重要的是,Skills 在 Claude 可用的所有场景都能运行:claude.ai 网页界面、Claude Code(Anthropic 的命令行编码智能体)以及 Claude API。编写一次 Skill,即可立即在所有平台上使用。对于投资 AI customization(即为自身需求专门定制 AI 功能)的企业而言,这种可移植性至关重要。

03 2025 年 12 月 18 日:开放标准正式发布

2025 年 12 月 18 日,三项公告几乎同时发布:

1)Anthropic 在 agentskills.io 上将 Agent Skills 规范作为开放标准发布,包含完整文档、参考版 Python SDK,以及对跨平台可移植性的明确承诺。

2)OpenAI 为其 Codex CLI 和 ChatGPT 采用了完全相同的 SKILL.md 格式。OpenAI 的开发者文档已同步更新,展示对 Skills 的支持,文件结构与 YAML frontmatter 与 Anthropic 保持一致。放置在 ~/.codex/skills/ 目录下的 Skills 会被自动发现并加载使用。

3)Microsoft 与 GitHub 宣布在整个 Copilot 生态中支持 Agent Skills:涵盖 GitHub Copilot、VS Code、Copilot CLI,以及 JetBrains、Eclipse 和 Xcode 等主流 IDE 中的 agent 模式。

与此同时,Anthropic 推出了 Skills Directory ------ 这是一个 Skills 精选市场,汇集了 Notion、Figma、Atlassian、Canva、Stripe、Ramp 和 Sentry 等合作伙伴打造的专业级 Skills。

面向 Team 与 Enterprise 套餐的企业客户,Anthropic 新增了组织级别的管理功能。管理员可为整个团队统一配置 Skills、设定默认启用项,并追踪使用情况。

其战略影响不言自明:Anthropic 的主要竞争对手 OpenAI,竟在该标准开源发布后数小时内便迅速采用;而 Microsoft 当时已有 23 万家企业使用 Copilot Studio(覆盖《财富》500 强中的 90%),正将 Skills 深度集成至其整套开发者工具链中。

04 12 月 19--31 日:市场爆发期

开放标准发布后 24 小时内,社区驱动的 Skills 市场平台如雨后春笋般涌现。独立社区项目 SkillsMP(Skills Marketplace)上线,通过自动抓取 GitHub 公共仓库实现了 Skills 索引自动化。

其增长轨迹令人瞩目:

  • 第 1 周(12 月 19--25 日):约 8,000 个 Skills 被索引
  • 第 2 周(12 月 26--31 日):约 17,000 个 Skills 被索引
  • 截至 2026 年 1 月 9 日:超过 25,000 个 Skills 被编目

这些并非重复或低质量内容。SkillsMP 设置了质量过滤机制,要求至少 2 个 GitHub stars 和近期更新记录,并扫描其基础质量指标。平台将 Skills 分为四大类:开发与技术类(占总量 40%)、文档类(25%)、企业与沟通类(20%),以及创意与设计类(15%)。

到 2025 年 12 月底,Skills 从 Anthropic 的私有功能演变为跨平台的行业标准,整个过程恰好历时 90 天。

05 技术实况核查:不绕弯子的拆解

5.1 架构本质:Markdown、YAML 与 Progressive Disclosure(渐进式披露)

Agent Skill 的核心设计极其简单:一个文件夹,内含一个带 YAML frontmatter 的 Markdown 文件,外加可选的资源文件。

其创新之处在于加载机制。渐进式披露通过三阶段加载机制实现:

  • 第一阶段 --- 启动时:智能体将所有 Skill 的元数据加载到系统提示词中。一个典型 Skill 的描述约 50 个词,消耗 40--50 个 tokens;100 个 Skills 的元数据总计约 4,000--5,000 个 tokens。
  • 第二阶段 --- 匹配时:处理用户请求过程中,智能体扫描 Skill 描述,识别相关匹配项。
  • 第三阶段 --- 加载时:匹配成功后,智能体通过文件系统工具读取完整的 SKILL.md 文件。此时完整内容才进入上下文窗口,根据复杂度消耗 2,000--5,000 个 tokens。

这种架构使得 Skill 库理论上可以无限扩展。一家企业可维护 1,000 个 Skills,元数据仅占用约 50,000 个 tokens,相当于 Claude Sonnet 4 20 万 token 上下文窗口的 25%。

5.2 Token 经济学:这才是它真正重要的原因

上下文窗口是有限且昂贵的资源。理解其中的 token 经济学,才能明白为什么 Skills 能成功,而其他方案却步履维艰。

5.3 Skills 无法做到的事情(坦诚环节)

  • 无法获取实时的外部数据:Skills 是静态文件。若无 MCP 服务器或直接的 API 工具集成,无法拉取实时数据。
  • 调用的非确定性:模型是否调用某个 Skill,是基于语义匹配的概率性决策,无法保证一定触发。
  • 调试过程不透明:当 Skill 未被触发或执行指令出错时,往往难以完全追溯原因。
  • 依赖代码执行环境:包含脚本的 Skills 需要代码执行环境支持(如 Claude Code 或 GitHub Copilot)。
  • 平台差异:虽然格式已标准化,但各平台在实现细节上仍有差异(例如文件发现路径)。

5.4 Skills 与其他方案对比 ------ 为什么 Skills 能成,而其他方案都失败了

现在来回溯一下 Skills 崛起的前两年究竟发生了什么。

1)Custom Instructions 时代:过于简单

2024 年 7 月,OpenAI 为 ChatGPT 引入 Custom Instructions。你可以设置"始终用 Python 写代码"或"我是资深工程师,跳过基础解释"。适合个人偏好,但面对复杂场景完全无能为力。

问题在于:你只能设置一套指令,始终加载、无法共享。试着在一个限制为 1500 个字符的文本框里解释你们公司 47 步的代码审查流程。然后看着你的同事手动重复这一过程,因为他们无法访问你的指令。

2)GPT Store 时代:虽接近但仍差一步

2024 年 11 月,OpenAI 推出 Custom GPTs,终于能构建带知识文件的专用智能体并分享出去。GPT Store 于 2025 年 1 月上线,到 6 月已积累 300 万个 GPTs。

那些拥有企业级需求的用户一开始很兴奋,但很快就撞墙了。

平台不互通:你的"API 安全审查 GPT"只能在 ChatGPT 里用,你们团队用 Claude,运维团队用 GitHub Copilot。恭喜,同一套逻辑你得维护三份副本。

上下文窗口不够用:GPTs 会预先加载全部知识。给 GPTs 塞 20 个示例文档?用户还没输入,上下文已吃掉 40,000 个 tokens。想维护 50 个供整个团队使用的 GPTs?上下文窗口直接宣告死亡。

缺乏治理:人人都能创建 GPTs,没有审批流程,没有版本控制。某天安全团队发现有人搭了个"SQL 查询助手",而它把所有数据库凭证都记录了 ------ 好戏就开始了。

到 2025 年年中,拥有企业级需求的那些用户都有一股挫败感:方向是对的,但这条路走不通。

3)2025 年 10 月:Skills 找对了路子

Anthropic 看清了哪些要素行之有效(GPTs 的专业化能力),什么行不通(其他所有尝试),然后将其简化到最本质的内容:

一份 Markdown 文件。仅此而已。

没有绑定平台 ------ 随处可用。没有预加载成本 ------ 用时才付费。天然适配 Git ------ 像普通代码一样做版本控制。具备在中大型企业环境中规模化、安全、合规地部署和使用的能力 ------ 安全团队能直接审查文件内容。

Skills 的采用曲线说明了一切:第一周 8,000 个 Skills,第三周突破 25,000 个。标准发布后 48 小时内,Microsoft 和 OpenAI 相继采纳了这一格式。

当你的竞争对手立刻照搬你的东西时,你就已经赢了。

5.5 关于 MCP,人人都问错了问题

人们总在问:"我该用 Skills 还是 MCP?"

这个问题本身就错了。它们干的是完全不同的事。

MCP 负责连接外部系统 ------ 它是智能体的"手",能伸进 Slack、拉取数据库、调用 API。没有 MCP,智能体就被困在自己的上下文窗口里,寸步难行。

Skills 用于指导工作流 ------ 它是智能体的"训练手册",告诉它如何做代码审查、什么算好的 API 设计、何时该升级问题。没有 Skills,智能体虽能访问一切,却对你的业务流程一无所知。

5.6 实际应用中是这样的

销售团队问:"我们的 pipeline 里有哪些卡住的单子?"

仅用 MCP:

  • 智能体通过 MCP 连接 Salesforce
  • 返回:47 条 JSON 格式的订单记录
  • 用户手动逐条审查
  • 耗时 30 分钟

仅用 Skills:

  • 智能体无法访问 Salesforce
  • 用户手动导出数据
  • 智能体用 Skills 中的规则分析
  • 耗时 20 分钟

两者结合:

  • 智能体通过 MCP 连接 Salesforce
  • 自动加载 "pipeline-review" Skill
  • 关联 Slack 中的相关对话
  • 生成卡单的 Markdown 表格
  • 标记出 3 个需立即跟进的订单
  • 建议具体的跟进步骤
  • 耗时 3 分钟

这正是 Notion 为其"Meeting Intelligence"Skill 搭配 MCP 连接的原因:MCP 抓取日历、相关文档和近期的 Slack 讨论;Skill 则懂得如何将这些信息整合成符合你公司标准的会议准备模板。

这套组合的 token 消耗约 18,000。数字听着不少,但你得意识到,你的助手刚用 30 秒干完了原本要花 45 分钟的活。

5.7 微调 与 Skills 之争

这里正是资金浪费重灾区。

微调方案是通过训练改变模型的权重。你喂给它示例数据,跑昂贵的计算任务,等上好几天,最终得到一个专用模型。单次训练成本在 500 到 5,000 美元之间。

Skills 则只是在运行时注入指令。编辑一份 Markdown 文件,5 分钟搞定,成本几乎为零。

陷阱在于,很多团队总以为需要微调,其实用 Skills 就够了。

如果医疗初创公司希望智能体理解肿瘤学术语,微调确实是合理的,因为你是在教它基础模型原本不懂的专业语言。

但如果你的团队只想让智能体遵循代码审查流程?那该用 Skill。模型本身已经懂代码审查,你只是在指定你们团队的特定标准。

5.8 二八定律

现代基础模型(Claude Sonnet 4、GPT-4o、Gemini 2.0)开箱即用的能力已相当惊人。对大多数团队而言:

  • 80% 的需求:一个 Skill 就能搞定
  • 20% 的边缘场景:或许才需要微调

真正需要微调的场景:

  • 涉及专业术语的医疗报告
  • 有特定引用格式的法律文书
  • 充斥着领域专业术语的科研论文
  • 对速度有极致要求的高吞吐任务

Skills 完全够用的场景:

  • 遵循公司内部流程
  • 应用标准与模板
  • 正确使用内部工具
  • 基于既定规则做决策

关键差异:Skills 可即时更新。API 标准变了?改个文件,重启即可。微调则每次变更都得重新训练。按季度重新训练,一年光维持更新就要烧掉 12,000 美元。

06 多家科技巨头围绕 AI 智能体定制化标准展开的战略博弈

6.1 12 月 18 日的妙手

2025 年 12 月 18 日,三家公司几乎在同一时间发布声明。如果你眨眼了,你就会错过今年 AI 基础设施领域最精彩的一场权力博弈。

太平洋时间 9:00:Anthropic 发布 agentskills.io ------ 一套带有参考实现、示例 Skills 和完整文档的开放标准,完全免费。

太平洋时间 11:30:OpenAI 更新开发者文档。Codex CLI 正式支持 SKILL.md 格式。没有新闻稿,只有一条静默的 changelog。

太平洋时间 14:00:Microsoft 为 GitHub Copilot 和 VS Code 增加 Skills 支持。同样悄无声息,某天打开编辑器,它就在那儿了。

三家竞争对手在五小时内集体采用同一套格式?这绝非偶然。

6.2 Anthropic 的布局

来看看 Anthropic 的布局,以及它为何能够奏效。

10月16日:将 Skills 作为 Claude 的私有功能推出,让企业用户上钩。Box 用它自动化文档处理流程,Rakuten 用它简化财务运营流程。

11月:坐观使用量极速增长。Skills 从内部工具演变为生产依赖组件。此时,企业用户已与之深度绑定。

12月18日:将该技术作为开放标准发布。所有人构建的 Skill 依然可用,但现在它们无处不在。

这正是 Anthropic 在 Model Context Protocol(MCP)上用过的同一套打法:

  • 2024 年 11 月:为 Claude 推出 MCP
  • 12 个月:社区共建生态
  • 2025 年 12 月 9 日:捐赠给 Linux Foundation,成为开放标准

作为私有功能发布 → 生态培育 → 开放开源。这正逐渐成为 Anthropic 的标志性策略。

6.3 为何 OpenAI 立刻采用了这一技术

12 月 18 日,OpenAI 面临两个选择:

  • 选项 A:无视 Skills,全力推 GPT Store 和 AgentKit,靠平台绑定留住用户。
  • 选项 B:采纳 Skills,放弃差异化,以执行能力而非生态壁垒竞争。

他们不到三小时就选了 B。

这正是耐人寻味之处。

OpenAI 正同时执行两套看似矛盾的策略:

私有化路线: 带收入分成的 GPT Store、面向复杂多智能体系统的 AgentKit、定制语音模式 ------ 这些是竞争对手难以复制的护城河。

开放标准路线: 2025 年 12 月采纳 MCP,同日拥抱 Skills,积极参与共享基础设施建设。

这正是"Android 策略" ------ 在采纳开放标准的领域共建生态,同时在平台层构建差异化。OpenAI 清楚:开发者不会为锁定单一供应商的定制方案投入资源。

他们的算盘是:与其独占一个小市场,不如在一个大市场里占据三成份额。

事实印证了这一点:截至 2026 年 1 月,Skills 已可在 ChatGPT 桌面端、Codex CLI 和 API 集成中运行,OpenAI 团队还深度参与了 Skills 标准的后续讨论 ------ 他们不只是采用这一技术,而是在共同开发。

6.4 Microsoft 的选择:拥抱并集成

Microsoft 拥有 23 万家企业用户使用 Copilot Studio,覆盖《财富》500 强中的 90%。当 Anthropic 开放 Skills 时,Microsoft 本是最可能受损的一方。他们花了数年时间搭建 Copilot 的知识连接器、自定义指令、插件体系,一整套企业级基础设施。

他们本可以筑墙自守,却选择了搭桥互通。

12月18日:Skills 支持覆盖整个 Copilot 生态 ------ VS Code、GitHub Copilot、Copilot Studio,以及所有主流 IDE。

策略很清晰:"用我们的执行环境,带你的 Skills 来"。Microsoft 不再试图掌控定制层,而是押注规模效应:更多开发者、更多推理请求、更多 Azure 算力消耗。

这是 Microsoft 云战略在 AI 领域的复制。还记得他们开源 .NET、拥抱 Linux 吗?这是同一套逻辑。当你是基础设施提供商时,你是通过增加总使用量获胜,而非通过锁定格式。

效果立竿见影:对 Skills 的支持直接推动了已投入 Claude Skills 的企业加速采用 Copilot。

6.5 Google 的静默反制

当其他厂商纷纷采纳 SKILL.md 时,Google 走了另一条路。

2025 年 10 月 8 日:Gemini CLI 推出 Extensions。不是 Skills,是 Extensions。不是 SKILL.md,是 GEMINI.md

二者的结构相似:YAML 头部、Markdown 主体、渐进式加载。但差异足以造成互不兼容。

到 12 月:70+ 个 Gemini Extensions,超 100 万开发者,独立市场平台成型。

所有人都在问:这是格式战争,还是和平共存?

乐观派:两种格式都能存活。格式转换极其简单 ------ SKILL.mdGEMINI.md 基本是查找替换。多格式支持终将成为标配。

悲观派:Google 看到 Skills 势头太猛,急需差异化筹码。宁可掌控一个小生态,也不愿在他人的地盘当配角。

现实情况是:截至 2026 年 1 月,尚无融合迹象。Gemini Extensions 与 Agent Skills 服务于重叠但有差异的场景 ------ Extensions 更深度绑定 Google Workspace,Skills 则保持更强的平台无关性。

结局可能如同 IDE 扩展格式之争 ------ VS Code 与 JetBrains 各自以不兼容的格式蓬勃发展。也可能最终迫使行业走向统一标准。现在下结论,为时过早。

6.6 Skills 开放标准发布后,开发者生态爆发式增长

当巨头们在谈判桌上运筹帷幄时,开发者们已全速行动。

12 月 19 日:SkillsMP 上线 ------ 首个独立的 Skills 市场平台。

12 月 31 日:8,000 个 Skills 可用。

2026 年 1 月 9 日:25,000 个 Skills。三大市场平台同台竞争。各细分品类头部作品开始涌现。

这才是真正赢得格式战争的关键。不是企业战略------而是生态势能。

当 25,000 个 Skills 同时在三大主流平台上运行,网络效应便进入自我强化循环:

  • 开发者构建 Skills,因为有分发渠道
  • 平台支持 Skills,因为有内容供给
  • 用户期待 Skills,因为它们无处不在

Google 的 GEMINI.md 拥有 70+ 个扩展,这已相当可观。但 Skills 的数量是它的 350 倍。网络效应就是如此残酷。

6.7 这对 2026 年意味着什么

战略格局已然清晰:

Anthropic:赢下了标准化之战,通过放弃独占性,收获整个生态。这笔交易是刻意为之,他们相信:在足够大的市场中做最好的执行者,远胜于在小池塘里做唯一的主人。

OpenAI:完美对冲。在关键处保留私有功能(GPT Store、语音),在生态系统重要的领域拥抱开放标准(MCP、Skills)。在执行质量上竞争。

Microsoft:走量策略。只要所有推理都跑在 Azure 上,谁的格式胜出并不重要。

Google:两线作战 ------ GEMINI.md 对抗 SKILL.md,Gemini 对抗 Claude/GPT-4。处境虽艰难,但并非没有希望。

6.8 真正的赢家

真正的赢家是开放格式。

在 AI 智能体开发的历史上,你首次能够构建一套定制方案,随处运行。你的代码审查 Skill 能在 Claude、ChatGPT、Copilot 乃至(稍作修改后)Gemini 上运行。

这在 AI 工具史上从未发生过。此前每一代方案,从 Custom GPTs 到插件再到 Actions,都因平台绑定而消亡。

Skills 或许真能长久存在,恰恰因为没人独占它。

07 Skills 市场平台的爆发

7.1 三周内从 0 到 25,000

12月18日:公开市场中 0 个 Skills。

12月19日:SkillsMP 上线,首发 127 个 Skills。

12月26日:8,000 个 Skills。

1月9日:25,000 个 Skills。

而 Chrome 扩展花了两年才达到 10,000 个;VS Code 扩展用了 18 个月达到 8,000 个。Skills 仅用一周便达成。

这是 AI 工具史上生态增长最快的一次。

7.2 为何爆发得如此之快

开发者早已在等待这样的方案。

GPTs 过于封闭,微调成本太高,自定义指令又太过局限。Skills 是那个"刚刚好"的方案 ------ 强大到足以干实事,简单到一下午就能构建,可移植性又足以产生影响。

此外,每家已经构建了 Claude Skills 的公司都能立即发布它们。Box 的文档转换 Skills?发布了。Rakuten 的财务自动化?发布了。房地产定价分析?发布了。

到 12 月 20 日,Skills 市场平台已被真实企业用户贡献的生产级内容迅速填满。

7.3 人们究竟构建了什么 Skills

细分如下:

40% 开发工具类 ------ 代码审查、API 设计、安全扫描、测试生成。每个工程团队都有自己那一套想自动化的流程。

赢家:"API Standards Enforcer" ------ 17,000 次下载。在 PR 审查阶段自动检查 OpenAPI 规范是否符合标准。某团队每周节省 8 小时。

25% 文档处理类 ------ 会议纪要、合同分析、技术写作。遵循固定模式的知识工作。

赢家:"Meeting Intelligence" ------ 12,000 次下载。由 Notion 开发,聚合日历、文档与 Slack 讨论,自动生成会议准备材料。每场会议节省 30 分钟。

20% 企业运营类 ------ 销售漏斗审查、财务分析、合规检查。融合多数据源的业务流程。

赢家:"Sales Pipeline Analyzer" ------ 9,000 次下载。在销售团队察觉前标记即将停滞的订单。报告称成交率提升 15%。

15% 创意与内容类 ------ 博客结构、内容复用、品牌一致性。营销自动化场景。

赢家:"Technical Blog Factory" ------ 6,000 次下载。研究笔记 → 大纲 → 初稿,首稿撰写提速 60%。

7.4 质量问题

到 1 月,三大 Skills 市场平台共收录 25,000+ 个 Skills,问题随之浮现:

寻找优质项目困难:搜索"code review"返回 400 个结果,半数是重复,四分之一无法运行,另四分之一已过时。

缺乏质量信号:不像 npm 或 Chrome 扩展,没有下载量、用户评分等指标,选择如同盲人摸象。

文档混乱:部分 Skills 附带完整示例与测试,另一些仅写"Reviews code. Use for reviewing." ------ 感谢,真帮大忙了。

"版本地狱" :Skills 本质是仓库中的文件,作者可能无声推送具有破坏性的内容变更,导致两周前还能用的 Skill 突然失效。

市场平台迅速响应 ------ 引入用户评分、下载计数、认证徽章、精选合集。到 1 月中旬,质量信号初具雏形,但距离 npm 这类成熟生态仍有巨大差距。

7.5 利润来源与商业价值所在

大多数 Skills 免费开放。25,000 个中约 21,000 个采用 MIT 或 Apache 许可证。

部分采用免费增值模式:基础版免费,专业版收费。"API Standards Enforcer" 对"无限次检查"权限与自定义规则收取 49 美元/月。

但真正的利润藏在 Skills 周边的企业级基础设施中。

企业不为单个 Skills 付费,而是为以下能力买单:

  • 带权限控制的私有仓库
  • 全组织范围的部署能力
  • 治理与合规支持
  • 定制化与技术支持

Box 为 2,000 名员工部署了 40+ 个内部 Skills。他们并未从市场购买,而是自建了管理基础设施。

SkillsMP 看清了这一点,采用免费市场平台,对企业级功能收费:

  • 私有团队仓库:200 美元/月
  • 企业级管理后台:1,000 美元/月
  • 可被企业以自身品牌重新包装并私有化部署的市场平台服务:5,000 美元/月
  • 支持 SLA:10,000 美元/月

他们卖的不是 Skills,而是基础设施。

7.6 下一步将发生什么

到 2026 年年中:

市场洗牌:三大市场将收敛为一个市场主导平台和一个专注于企业客户的平台。历史将不断重演,npm 战胜 Bower,Chrome 商店胜过 Firefox 附加组件。

质量门槛提升:缺乏文档、测试或维护的 Skills 将被淘汰,专业级作品成为主流。

企业工具成熟:公司在 Skill 管理上的投入将超过 Skills 本身。出现类似 Artifactory 的内部 Skill 仓库。

垂直领域深化:医疗、金融、法律等行业的专用 Skills 成为利润高地。

格式升级:现行 SKILL.md 将增加版本控制、依赖管理、安全元数据。GitHub 与 Anthropic 已启动 v2 规范讨论。

爆发期即将结束,专业生态系统阶段正在开启。

关键是,从杠杆率最高的工作流切入。严格衡量成效。放大有效实践。果断淘汰无效尝试。

08 你需要知道的关键信息

我们刚刚见证了 AI 基础设施史上最快的普及进程:三周内从 0 到 25,000 个 Skills。五小时内四家巨头向同一标准收敛;整个生态在多数人还在忙着节日购物时悄然成型。

下面说重点。

8.1 战略层面的真相

Skills 能赢,恰恰因为它比较无聊。

没有区块链,没有复杂运行时,没有私有协议。就是 Git 仓库里能被任何智能体读取的 Markdown 文件。2025 年最具颠覆性的 AI 基础设施,本质上不过是一种文本文件格式。

真正能被广泛采纳的基础设施,靠的不是炫目的技术革命,而在于能否降低整个生态的协作成本。HTTP 战胜了 Gopher,JSON 战胜了 XML,REST 战胜了 SOAP,Markdown 在文档领域碾压一切。

Skills 再次证明:在开发者工具领域,无聊的方案反而更容易胜出。

8.2 这对你意味着什么

如果你在用AI智能体构建产品:

在 AI 工具领域,标准化问题长期无解 ------ 过去每家平台都筑起围墙,定制化方案换个地方就得重写一遍。如今,Skills 首次真正破局:一次编写,处处运行。你的 Skill 写完后,无需修改即可在 Claude、ChatGPT 和 Copilot 间无缝流转。这种可移植性将直接重塑你的架构决策。

如果你是架构师,Skills 现在已是非选不可的基础设施,不再是锦上添花。你需要一套策略来应对:

  • 如何管理内部 Skills(自建仓库?)
  • 如何审核第三方 Skills(安全审查流程?)
  • 如何治理(谁批准新 Skill?)
  • 如何与现有工具集成(CI/CD、监控?)

2025 年初想清楚这些问题的公司,将比 2026 年才起步的对手领先整整一年。

如果你是技术负责人,这是个自研还是采购的决策 ------ 无论你是否意识到,你已经在做选择了。

  • 自研:针对公司特有的工作流构建内部 Skills ------ 企业标准、合规规则、领域专长。这才是你的竞争优势。
  • 采购:管理 Skills 的基础设施 ------ Skill 仓库、安全扫描、部署系统。别自己造轮子,通用基础设施交给专业厂商。

预算参考:

  • Skill 开发:中型团队每年 50K--200K
  • Skill 基础设施:每年 100K--500K

投资回报率高得离谱 ------ 某家房地产公司通过 8 个自动化房产分析工作流的 Skills,每年节省了 200 万美元。你的数据可能没这么夸张,但哪怕只有十分之一,几个季度就能回本,不用等上好几年。

8.3 接下来会发生什么

爆发阶段已经结束,专业生态系统阶段正在开启。到 2026 年年中,预计 Skills 市场平台将出现整合、Skills 质量门槛将会提高、企业级工具将成熟,并出现垂直领域专业化(医疗 Skills、金融 Skills、法律 Skills)。

格式本身也会演进。现行 SKILL.md 将增加版本控制、依赖管理和安全元数据。GitHub 与 Anthropic 已启动 v2 规范讨论。但核心概念 ------ 带 YAML frontmatter 的 Markdown 文件,会继续保持"无聊"。而这正是它能长久存在的原因。

END

本期互动内容 🍻

你所在的公司或团队,已经开始整理自己的"Skills仓库"了吗?如果还没有,你觉得最大的阻碍是认知不足、工具缺失,还是根本用不上?

原文链接:

ai.gopubby.com/how-agent-s...

相关推荐
Moment2 小时前
Agent 开发本质上就是高级点的 CRUD
前端·后端·面试
风象南2 小时前
5分钟在ClawHub发布你的第一个Agent技能
人工智能
stark张宇2 小时前
避坑指南:Windows 用户安装 OpenClaw 的正确姿势,拒绝失败率 100%
人工智能·后端·llm
恋猫de小郭2 小时前
OpenAI 亲自教你如何构建可靠 AI 代码,从古法编程转向 Agnet 编程,或者 PUA 你的 AI
前端·人工智能·ai编程
yiyu071612 小时前
3分钟搞懂深度学习AI:实操篇:池化层
人工智能·深度学习
亚马逊云开发者12 小时前
5 分钟用 Amazon Bedrock 搭一个 AI Agent:从零到能干活
人工智能·agent·amazon
哈里谢顿12 小时前
0305乒乓xx agent运维开发岗面试记录
面试
哈里谢顿12 小时前
0309面试二总结
面试