为什么Anthropic说:AI的未来是Skills不是Agent?

随着AI智能体(Agent)技术的快速演进,当前开发领域普遍存在一种认知偏差:针对不同细分场景和具体用例,开发者倾向于从零开始创建独立的Agent。

Anthropic公司的Barry Zhang与Mahesh Murag在近期演讲中颠覆了这一传统思路,他们倡导的创新方法论明确指出:"聚焦技能(Skills)开发,而非重复构建Agent"。

1. 现有的问题:通用智能 vs. 领域专长

当前AI Agent虽具备卓越的智商与通用能力,却普遍存在‌领域专业知识(Expertise)‌的短板。

演讲者通过类比说明:解决税务问题时,人们需要的是精通税务的专家(Barry),而非即便智商高达300却需从零研读税法的数学天才(Mahesh)。

现有Agent恰似后者,若无专业背景与指导支持,在具体任务中难以达到理想表现。

更多AI大模型学习视频及资源,都在智泊AI

2. 什么是"Agent Skills"?

问题解决方案‌:Anthropic 创新性地开发了 Agent Skills(智能体技能)框架。

‌核心定义‌:将程序性知识封装为标准化单元,其底层逻辑与文件夹结构一致。

‌模块组成‌

提示词(Prompts)、执行脚本(Scripts)、配套说明文档

‌设计优势‌

‌直观性‌:采用文件系统架构,天然适配Git版本控制、Google Drive协作等现有工作流

‌扩展性‌:支持通过代码脚本实现工具功能,利用代码的自文档化和可迭代特性,显著提升指令执行精度

3. 运作机制:节省上下文窗口

为避免Agent在掌握数百项技能时超出上下文窗口(Context Window)的容量限制,Anthropic创新性地引入了渐进式披露(Progressive Disclosure)机制。

该机制下,模型在初始运行阶段仅能访问技能的元数据(Metadata),待Agent主动调用特定技能后,才会进一步加载其完整指令与相关文件内容。

4. 蓬勃发展的生态系统

自发布以来,技能生态系统已形成三大核心类别:

‌基础技能‌

为Agent提供通用功能支持,包括Office文档处理及科研任务执行(例如生物信息学数据分析场景)。

‌合作伙伴技能‌

实现第三方工具的无缝整合。典型案例:Notion开发了帮助Claude深度解析工作区数据的技能;Browserbase则提供了浏览器自动化操作技能。

‌企业内部技能‌

当前发展最迅猛的领域。头部企业正通过定制化技能训练Agent,使其适配内部代码规范、操作专属软件或完成特定财务流程。

5. 面向未来的架构:MCP + Skills

Anthropic 提出了一种明确的通用智能体架构框架:

‌Agent Loop‌:负责调控模型的推理流程

‌Runtime 环境‌:集成文件管理与代码运行功能

‌MCP (Model Context Protocol)‌:作为对接外部数据与工具的接口(实现系统与外部交互的核心通道)

‌Skills‌:封装领域专业知识库(智能体的认知储备)

该设计使得业务专家(如财务/法务人员)能够通过配置基础技能模块来增强AI的功能边界。

6. 终极愿景:自我进化的知识库

最让人期待的突破在于AI的进化能力。‌

Claude已具备自主创建技能的功能。例如,当它掌握了一项新任务(如撰写特定风格的PPT脚本),能够将该能力封装为可复用的"技能"模块。

这种机制使"经验积累"转化为实体化资产。通过持续的技能迭代,第30天的Claude将展现出远超初始版本的能力维度。

总结

演讲结尾通过计算机演进史构建了一个巧妙比喻:

‌模型 (Model)‌ 如同 ‌处理器 (Processor)‌:具备惊人潜力却难以独立发挥作用。

‌Runtime/Agent‌ 则类比 ‌操作系统 (OS)‌:核心职能在于资源协调与界面管理。

而 ‌技能 (Skills)‌ 恰似 ‌应用程序 (Software)‌:真正体现专业价值、实现具体功能的载体。

当前更应聚焦开发多元化的"应用程序"(Skills),而非重复构建基础"操作系统"(Agent)。

更多AI大模型学习视频及资源,都在智泊AI

相关推荐
CoderJia程序员甲6 小时前
GitHub 热榜项目 - 日榜(2025-12-15)
git·ai·开源·llm·github
未来魔导7 小时前
PocketBase的自定义任务【专供LLM请求耗时任务】
llm·延时任务·pocketbase
Robot侠7 小时前
极简LLM入门指南1
llm·llama
大模型教程8 小时前
这份中国人写的大模型书,在外网竟然被刷爆了!
程序员·llm·agent
大模型教程9 小时前
大模型入门指南 - Training:小白也能看懂的“模型训练”全解析
程序员·llm·agent
AI大模型9 小时前
一文读懂大模型智能体(Agent):从理论到实践
程序员·llm·agent
AndrewHZ9 小时前
【大模型技术学习】大模型压力测试全攻略:以Qwen3-32B为例
人工智能·大模型·llm·压力测试·模型部署·通义千问·qwen3-32b
暴风鱼划水10 小时前
大型语言模型(入门篇)A
人工智能·语言模型·自然语言处理·大模型·llm
坐吃山猪1 天前
BrowserUse12-源码-MCP模块
python·llm·playwright·browser-use