为什么Anthropic说:AI的未来是Skills不是Agent?

随着AI智能体(Agent)技术的快速演进,当前开发领域普遍存在一种认知偏差:针对不同细分场景和具体用例,开发者倾向于从零开始创建独立的Agent。

Anthropic公司的Barry Zhang与Mahesh Murag在近期演讲中颠覆了这一传统思路,他们倡导的创新方法论明确指出:"聚焦技能(Skills)开发,而非重复构建Agent"。

1. 现有的问题:通用智能 vs. 领域专长

当前AI Agent虽具备卓越的智商与通用能力,却普遍存在‌领域专业知识(Expertise)‌的短板。

演讲者通过类比说明:解决税务问题时,人们需要的是精通税务的专家(Barry),而非即便智商高达300却需从零研读税法的数学天才(Mahesh)。

现有Agent恰似后者,若无专业背景与指导支持,在具体任务中难以达到理想表现。

更多AI大模型学习视频及资源,都在智泊AI

2. 什么是"Agent Skills"?

问题解决方案‌:Anthropic 创新性地开发了 Agent Skills(智能体技能)框架。

‌核心定义‌:将程序性知识封装为标准化单元,其底层逻辑与文件夹结构一致。

‌模块组成‌

提示词(Prompts)、执行脚本(Scripts)、配套说明文档

‌设计优势‌

‌直观性‌:采用文件系统架构,天然适配Git版本控制、Google Drive协作等现有工作流

‌扩展性‌:支持通过代码脚本实现工具功能,利用代码的自文档化和可迭代特性,显著提升指令执行精度

3. 运作机制:节省上下文窗口

为避免Agent在掌握数百项技能时超出上下文窗口(Context Window)的容量限制,Anthropic创新性地引入了渐进式披露(Progressive Disclosure)机制。

该机制下,模型在初始运行阶段仅能访问技能的元数据(Metadata),待Agent主动调用特定技能后,才会进一步加载其完整指令与相关文件内容。

4. 蓬勃发展的生态系统

自发布以来,技能生态系统已形成三大核心类别:

‌基础技能‌

为Agent提供通用功能支持,包括Office文档处理及科研任务执行(例如生物信息学数据分析场景)。

‌合作伙伴技能‌

实现第三方工具的无缝整合。典型案例:Notion开发了帮助Claude深度解析工作区数据的技能;Browserbase则提供了浏览器自动化操作技能。

‌企业内部技能‌

当前发展最迅猛的领域。头部企业正通过定制化技能训练Agent,使其适配内部代码规范、操作专属软件或完成特定财务流程。

5. 面向未来的架构:MCP + Skills

Anthropic 提出了一种明确的通用智能体架构框架:

‌Agent Loop‌:负责调控模型的推理流程

‌Runtime 环境‌:集成文件管理与代码运行功能

‌MCP (Model Context Protocol)‌:作为对接外部数据与工具的接口(实现系统与外部交互的核心通道)

‌Skills‌:封装领域专业知识库(智能体的认知储备)

该设计使得业务专家(如财务/法务人员)能够通过配置基础技能模块来增强AI的功能边界。

6. 终极愿景:自我进化的知识库

最让人期待的突破在于AI的进化能力。‌

Claude已具备自主创建技能的功能。例如,当它掌握了一项新任务(如撰写特定风格的PPT脚本),能够将该能力封装为可复用的"技能"模块。

这种机制使"经验积累"转化为实体化资产。通过持续的技能迭代,第30天的Claude将展现出远超初始版本的能力维度。

总结

演讲结尾通过计算机演进史构建了一个巧妙比喻:

‌模型 (Model)‌ 如同 ‌处理器 (Processor)‌:具备惊人潜力却难以独立发挥作用。

‌Runtime/Agent‌ 则类比 ‌操作系统 (OS)‌:核心职能在于资源协调与界面管理。

而 ‌技能 (Skills)‌ 恰似 ‌应用程序 (Software)‌:真正体现专业价值、实现具体功能的载体。

当前更应聚焦开发多元化的"应用程序"(Skills),而非重复构建基础"操作系统"(Agent)。

更多AI大模型学习视频及资源,都在智泊AI

相关推荐
AndrewHZ38 分钟前
【AI黑话日日新】什么是AI智能体?
人工智能·算法·语言模型·大模型·llm·ai智能体
山顶夕景5 小时前
【LLM】多模态智能体Kimi-K2.5模型
llm·agent·多模态
JTnnnnn5 小时前
【架構優化】拒絕 LLM 幻覺:設計基於 Python 路由的 AntV 智慧圖表生成系統
llm·antv·dify
AndrewHZ6 小时前
【AI黑话日日新】什么是skills?
语言模型·大模型·llm·claude code·skills
国家一级假勤奋大学生15 小时前
InternVL系列 technical report 解析
大模型·llm·vlm·mllm·internvl·调研笔记
缘友一世1 天前
张量并行和流水线并行原理深入理解与思考
学习·llm·pp·tp
CoderJia程序员甲1 天前
GitHub 热榜项目 - 日榜(2026-01-30)
开源·大模型·llm·github·ai教程
亚里随笔1 天前
MegaFlow:面向Agent时代的大规模分布式编排系统
人工智能·分布式·llm·rl·agentic
大熊猫侯佩2 天前
赛博深渊(上):用 Apple Foundation Models 提炼“禁忌知识”的求生指南
llm·swiftui·大语言模型·foundationmodel·apple ai·apple 人工智能·summarize
Jack_abu2 天前
谷歌开源翻译模型 TranslateGemma 深度解析与本地部署实践
llm·机器翻译·ollama·开源翻译模型