AI Agent下半场:模型能力过剩,Skill生态成为新壁垒

写在前面

2026年过半,AI行业正在经历一场深刻的范式转移。上半年,OpenAI GPT-5.5 Pro输出价格高达180美元/百万Token,谷歌、Anthropic纷纷推动模型涨价;与此同时,Agent工作流天然是"Token黑洞",一次搜索+推理+工具调用跑下来,Token消耗量轻松达到普通对话的十倍以上。大厂们一边涨价一边发力Skill商店------腾讯、阿里、字节先后上线自己的Skill平台。这一幕揭示了一个正在发生的事实:大模型能力正在过剩,真正的竞争壁垒已经转移到了Skill生态上。 当基础模型能力趋于同质化,谁能封装最多的专业工作流,谁就能让Agent真正"干活"。本文将从模型端的"内卷终结"和Skill端的"生态爆发"两条线索,拆解这场变革的前因后果。

一、模型下半场:从"拼智力"到"拼成本"

1.1 Token价格战的尽头

2023年初,GPT-4的API定价约每百万Token 30美元;到了2025年末,主流模型的Token价格已经下降了90%到99%。OpenAI GPT-4o mini降至0.15美元/百万Token,Anthropic Claude 3.5 Haiku低至0.25美元,Google Gemini 2.0 Flash压至0.10美元。

但对于Agent应用来说,情况反而更糟了。市面上大模型的API价格确实便宜了,但Agent工作流的Token消耗量是指数级增长的。一次简单的问题------让Agent查资料、整理、生成报告------背后可能包含多轮工具调用、多轮推理,Token消耗轻松达到普通对话的十倍甚至更多。

与此同时,海外头部模型正在从"降价换市场"转向"涨价保利润"。以Token计费为例,OpenAI GPT-5.5的输出价格达到30美元/百万Token,高性能版本GPT-5.5 Pro更高达180美元/百万Token。企业服务也转变为"固定底价+API实际Token消耗"计费。

1.2 模型能力溢价正在消失

当模型能力差距只剩下"几个月的领先",而价格却差两三倍时,企业的选择自然会偏向便宜方案。OpenAI和Anthropic准备赴美上市时,必须面对的正是这个问题:如何证明自己的模型值得更高的定价?

模型能力的"内卷"已经进入瓶颈期。Llama、DeepSeek、通义千问等开源或低成本模型正在迅速缩小与闭源模型的能力差距。这意味着:依赖"独家能力"构建护城河的商业模式,正在崩塌。

1.3 Token成本的底层逻辑

Agent工作流的Token消耗量为何如此惊人?一次简单的Agent调用链路------用户提问→推理规划→工具调用→结果观察→再次推理→最终输出------每一步都可能产生数千Token。下图直观展示了Agent执行链路中各环节的Token消耗分布:

与端到端的一次性问答相比,Agent的多轮迭代工作流使Token消耗量急剧上升,这让很多企业用户的实际API账单远超预期。

二、Skill的本质:从"一次性指令"到"可复用能力"

在模型能力趋同、Token成本上升的双重压力下,行业需要一种新的能力复用机制。Skill就是在这背景下诞生的解决方案。

2.1 什么是Skill?

Skill是一个包含元数据+操作指令+脚本/模板的标准化文件夹。一个Skill的目录结构大致如下:

复制代码
my-skill/
├── SKILL.md          # 必需:核心指令文档
├── scripts/          # 可选:可执行脚本(Python/Bash等)
├── references/       # 可选:参考文档和规范
└── assets/           # 可选:模板、素材等资源

其中SKILL.md包含YAML元数据块(name和description,约30-50 Tokens)和Markdown指令体(详细的"操作手册")。Anthropic官方将Skill精确定义为"将垂直领域专业知识封装为可复用、可版本控制的文件包,实现'即插即用'的任务执行"。

2.2 三层渐进式披露

Skill最精妙的设计是其"渐进式披露"(Progressive Disclosure)机制:

三层机制的价值在于:即便一个Agent安装了上百个Skills,启动时也只加载每个Skill的名称和简介(约100 Tokens/个),不会撑爆上下文窗口。只有当任务匹配时,才加载详细指令;只有当需要执行时,才加载脚本和资源文件。Token从"每轮对话都拉满"变成了"只为当前任务付费"。

2.3 Skill如何解决Token成本问题

Skill不仅是技术规范,更是一种新的AI成本控制范式。在传统模式下,每次对话都需要重复传达复杂的操作规范和流程。而在Skill体系下:

三、Skill生态爆发:85,000+技能的规模效应

3.1 关键数字

截至2026年初,Skill生态达到了一个令人瞩目的规模:

国内方面,SkillHub已聚合超过13000个Skills(数量仍在快速增长中)。skills.sh作为最大开放目录,支持npx skills find命令行检索,skillsmp.com更是号称拥有800,000+ Skills资源。

3.2 标准化的里程碑

2025年12月18日,Anthropic将Agent Skills规范发布至agentskills.io,使其成为跨平台可移植的开放标准。这是Skill从小众工具走向基础设施的关键节点。

Linux基金会也已启动讨论,拟将Agent Skills纳入其AI & Data基金会(AIDF)的候选标准之一。这意味着Agent Skills正在成为继MCP之后,AI Agent生态的又一个事实标准。

3.3 大厂为何争先布局Skill商店

今年以来,Skill商店的争夺战愈演愈烈。2026年3月,腾讯、阿里、字节先后在自家Agent平台上线了Skill商店;此后两个月,智谱、美团、小红书接连入场。每个大厂都有自己的布局逻辑:

Skill商店争夺战的本质,是AI时代流量入口的卡位------谁掌握分发权,谁就掌握用户。Skill生态正在成为决定AI应用能否规模化落地的基础设施,也是各大厂商构建护城河的战略重心。

四、MCP + Skills:AI Agent的"双螺旋"架构

4.1 核心定位差异

在开始深入对比之前,先抛出一句最本质的概括:Skills教AI"怎么思考"(How to think),MCP给AI"什么信息"(What to access)。两者如同DNA的双螺旋结构------既独立又互补,共同构成了现代智能体的能力基石。

具体来说:

  • MCP(Model Context Protocol) :是标准化通信协议,定义AI模型如何与外部系统建立安全、高效的连接,包括工具调用、资源访问等。在MCP出现前,为每个外部资源写"胶水代码"就像手机充电器接口各异;而MCP就是AI时代的"USB-C"------一次封装,多处复用。

  • Skills:是封装特定领域知识和最佳实践的"能力包"。它教会Agent按照什么流程做事、遇到什么情况如何判断、最终按什么标准输出结果。

下表从多个维度对两者进行详细对比:

4.2 协同架构:MCP给"手脚",Skills给"说明书"

在构建高效Agent系统时,这两个能力通常协同使用:

更关键的是,Skills和MCP正在从"互补"走向"融合"。MCP官方已成立 Skills Over MCP工作组,专门定义如何通过MCP来发现、分发和消费Agent Skills。这意味着Skills未来将被纳入MCP协议体系,成为MCP的一流原语(First-Class Primitive)。

五、Java开发者的Skill机遇

5.1 Java生态的Skill支持现状

好消息是,Java生态并未在Skill浪潮中缺席。2026年,Spring AI Alibaba 1.1.2.0版本正式发布了Agent Skills支持,为Java开发者提供了开箱即用的Skill管理能力。

该版本的核心特性包括:

  • ReactAgent集成Agent Skills,支持技能的渐进式披露

  • SkillsAgentHook自动管理技能发现和加载

  • SkillRegistry(FileSystemSkillRegistry和ClasspathSkillRegistry)管理技能目录

  • 支持技能列表注入系统提示 + read_skill工具调用的自动编排

Spring AI Alibaba的Skills框架解决了之前Agent"知道的太多"导致的上下文膨胀问题。通过渐进式披露机制,让智能体按需加载所需技能,实现"知道有技能→按需加载细节→动态调用工具"的完整流程。

5.2 Java开发者能做什么?

对于企业级应用,Skills与MCP的组合尤为关键:MCP负责标准化工具的连接,Skills负责定义特定领域的行为模式,而SubAgent则是这两者的执行载体。这种架构让构建复杂的企业级应用变得像搭积木一样可控。

5.3 代码示例:Spring AI Alibaba Skill使用

以下是一个最小可用的Skill使用示例:

java 复制代码
// Spring AI Alibaba 1.1.2.0 中集成Agent Skills
SkillRegistry registry = FileSystemSkillRegistry.builder()
    .projectSkillsDirectory(System.getProperty("user.dir") + "/skills")
    .build();

SkillsAgentHook hook = SkillsAgentHook.builder()
    .skillRegistry(registry)
    .build();

ReactAgent agent = ReactAgent.builder()
    .name("skills-agent")
    .model(chatModel)
    .saver(new MemorySaver())
    .hooks(List.of(hook))
    .build();

// Agent会自动发现skills目录下所有Skill
agent.call("请介绍一下你的技能");

六、Skill生态的三重价值

6.1 对开发者:降低门槛,提升效率

Skill让AI开发从"每次重新造轮子"变成了"即装即用"。传统开发中,每个Agent都需要重复实现文件处理、数据分析等基础功能;使用Skill后,每个Skill可被所有Agent共享,代码量减少60%,开发效率提升3-5倍。Skill正在成为AI领域的"Dockerfile"------让AI能力变得可移植、可组合、可版本控制

6.2 对企业:沉淀知识资产,构建竞争壁垒

当员工离职时,他积累的"怎么写需求文档"、"怎么做代码审查"的知识也随之流失。但如果将这些经验打包成Skill,知识就成了企业的沉淀资产,不再依附于个人。

Skill让企业的SOP(标准作业程序)从"写在Wiki里没人看"变成了"Agent自动执行"。当竞争对手也能用同样的基础模型时,你独有的Skill库就是最坚固的护城河。

6.3 对行业:加速AI Agent的规模化落地

Skill生态的爆发,意味着AI Agent的规模化落地正在从"拼模型"转向"拼应用"。不再是谁的模型参数多、上下文长,而是谁的Skill能覆盖更多的场景、更高质量地完成任务。

七、总结与行动建议

AI Agent的下半场已经拉开帷幕。模型能力的竞赛正在趋于饱和,Skill生态的竞赛才刚刚开始。

  • 模型能力不再是最稀缺的资源:API价格暴跌、模型能力差距缩小,真正的差异化在于谁能更好地封装和复用专业能力。

  • Skill的生态规模正在形成:8.5万+公开Skills、27家平台支持、Linux基金会纳入候选标准。Skill正在成为AI时代的能力基础设施。

  • Java开发者面临新的机遇期:Spring AI Alibaba等Java框架已经全面支持Skills + MCP的Agent架构。现在正是Java工程师学习并应用Skill来构建生产级Agent的最佳时机。

  • Skill + MCP的融合是未来趋势:MCP提供工具连接,Skills提供行为规范,两者结合构成Agent的完整能力体系。随着MCP官方Skills Over MCP工作组的推进,融合将更加深入。

给Java开发者的三条具体行动建议:

  1. 今天就开始试用:从Spring AI Alibaba的官方文档入手,跑通第一个Skill示例

  2. 封装第一个真实Skill:把你团队中最重复、最标准化的工作流程------代码审查规范、需求模板、发布检查清单------写成SKILL.md。一个Markdown文件就能让Agent学会按你们团队的标准做事

  3. 关注生态:SkillHub、skills.sh等平台上的优质Skill已经过万,取长补短,丰富自己的Skill库

相关推荐
圣殿骑士-Khtangc1 小时前
多智能体协作架构深度解析:MCP + A2A 协议栈,构建企业级 Multi-Agent 系统
人工智能
极连AI1 小时前
国产大模型譬如DeepSeek接入codex教程分享
人工智能·gpt·chatgpt·api·token·极连ai·zovelox.com
工控发烧友1 小时前
边缘计算 vs 云端处理:工业场景如何选择数据处理架构
人工智能·架构·边缘计算
keykey6.1 小时前
从感知机到神经网络:深度学习的起源
开发语言·人工智能·深度学习·机器学习
来让爷抱一个1 小时前
MonkeyCode vs Copilot vs Cursor:三大 AI 编程工具深度对比
人工智能·安全·开源·ai编程
老兵发新帖1 小时前
ROS2工作区目录结构分析
人工智能
AI Dog1 小时前
MathHub数学建模交流社区-V2
人工智能·机器学习·数学建模·阿里云
澹锦汐1 小时前
Serverless 架构下的支付系统设计:独立开发者的零运维订阅计费实战
人工智能