为什么Anthropic说:AI的未来是Skills不是Agent?

随着AI智能体(Agent)技术的快速演进,当前开发领域普遍存在一种认知偏差:针对不同细分场景和具体用例,开发者倾向于从零开始创建独立的Agent。

Anthropic公司的Barry Zhang与Mahesh Murag在近期演讲中颠覆了这一传统思路,他们倡导的创新方法论明确指出:"聚焦技能(Skills)开发,而非重复构建Agent"。

1. 现有的问题:通用智能 vs. 领域专长

当前AI Agent虽具备卓越的智商与通用能力,却普遍存在‌领域专业知识(Expertise)‌的短板。

演讲者通过类比说明:解决税务问题时,人们需要的是精通税务的专家(Barry),而非即便智商高达300却需从零研读税法的数学天才(Mahesh)。

现有Agent恰似后者,若无专业背景与指导支持,在具体任务中难以达到理想表现。

更多AI大模型学习视频及资源,都在智泊AI

2. 什么是"Agent Skills"?

问题解决方案‌:Anthropic 创新性地开发了 Agent Skills(智能体技能)框架。

‌核心定义‌:将程序性知识封装为标准化单元,其底层逻辑与文件夹结构一致。

‌模块组成‌

提示词(Prompts)、执行脚本(Scripts)、配套说明文档

‌设计优势‌

‌直观性‌:采用文件系统架构,天然适配Git版本控制、Google Drive协作等现有工作流

‌扩展性‌:支持通过代码脚本实现工具功能,利用代码的自文档化和可迭代特性,显著提升指令执行精度

3. 运作机制:节省上下文窗口

为避免Agent在掌握数百项技能时超出上下文窗口(Context Window)的容量限制,Anthropic创新性地引入了渐进式披露(Progressive Disclosure)机制。

该机制下,模型在初始运行阶段仅能访问技能的元数据(Metadata),待Agent主动调用特定技能后,才会进一步加载其完整指令与相关文件内容。

4. 蓬勃发展的生态系统

自发布以来,技能生态系统已形成三大核心类别:

‌基础技能‌

为Agent提供通用功能支持,包括Office文档处理及科研任务执行(例如生物信息学数据分析场景)。

‌合作伙伴技能‌

实现第三方工具的无缝整合。典型案例:Notion开发了帮助Claude深度解析工作区数据的技能;Browserbase则提供了浏览器自动化操作技能。

‌企业内部技能‌

当前发展最迅猛的领域。头部企业正通过定制化技能训练Agent,使其适配内部代码规范、操作专属软件或完成特定财务流程。

5. 面向未来的架构:MCP + Skills

Anthropic 提出了一种明确的通用智能体架构框架:

‌Agent Loop‌:负责调控模型的推理流程

‌Runtime 环境‌:集成文件管理与代码运行功能

‌MCP (Model Context Protocol)‌:作为对接外部数据与工具的接口(实现系统与外部交互的核心通道)

‌Skills‌:封装领域专业知识库(智能体的认知储备)

该设计使得业务专家(如财务/法务人员)能够通过配置基础技能模块来增强AI的功能边界。

6. 终极愿景:自我进化的知识库

最让人期待的突破在于AI的进化能力。‌

Claude已具备自主创建技能的功能。例如,当它掌握了一项新任务(如撰写特定风格的PPT脚本),能够将该能力封装为可复用的"技能"模块。

这种机制使"经验积累"转化为实体化资产。通过持续的技能迭代,第30天的Claude将展现出远超初始版本的能力维度。

总结

演讲结尾通过计算机演进史构建了一个巧妙比喻:

‌模型 (Model)‌ 如同 ‌处理器 (Processor)‌:具备惊人潜力却难以独立发挥作用。

‌Runtime/Agent‌ 则类比 ‌操作系统 (OS)‌:核心职能在于资源协调与界面管理。

而 ‌技能 (Skills)‌ 恰似 ‌应用程序 (Software)‌:真正体现专业价值、实现具体功能的载体。

当前更应聚焦开发多元化的"应用程序"(Skills),而非重复构建基础"操作系统"(Agent)。

更多AI大模型学习视频及资源,都在智泊AI

相关推荐
研究点啥好呢11 小时前
高德多模态算法工程师面试题精选:10道高频考题+答案解析
python·面试·llm·求职招聘·笔试·高德
程序设计实验室13 小时前
用本地大模型驱动中文输入法,我做了一个实验性的项目
ai·llm
怪我冷i15 小时前
多租户管理系统,用户表,IsSuperAdmin,IsTenantAdmin,IsCompanyAdmin,IsDeptAdmin需要吗?
golang·llm·多租户·skill
测试员周周15 小时前
【AI测试系统】第2篇:拒绝盲目 AI:规则引擎 10ms 自动生成 36 条测试用例实战(附源码)
llm·ai编程·测试
冬奇Lab15 小时前
RAG 系列(三):调对这 4 个参数,让你的 RAG 从「能用」变「好用」
人工智能·llm
数据智能老司机15 小时前
人人都能学会的提示词工程——人人都能学会的提示词工程
llm
数据智能老司机15 小时前
人人都能学会的提示词工程——提示素养:从习惯到精通
llm
Lw老王要学习16 小时前
本地部署OpenClaw + WSL Ubuntu + 千问云+QQ+微信+飞书
ubuntu·llm·agent·openclaw·龙虾
Irissgwe17 小时前
LangChain之核心组件(消息与提示词模板)
人工智能·ai·langchain·llm·langgraph
小锋学长生活大爆炸17 小时前
【开源软件】打造 macOS 纯本地 LLM 工作台 | Sidekick
macos·llm