随着AI智能体(Agent)技术的快速演进,当前开发领域普遍存在一种认知偏差:针对不同细分场景和具体用例,开发者倾向于从零开始创建独立的Agent。
Anthropic公司的Barry Zhang与Mahesh Murag在近期演讲中颠覆了这一传统思路,他们倡导的创新方法论明确指出:"聚焦技能(Skills)开发,而非重复构建Agent"。

1. 现有的问题:通用智能 vs. 领域专长
当前AI Agent虽具备卓越的智商与通用能力,却普遍存在领域专业知识(Expertise)的短板。
演讲者通过类比说明:解决税务问题时,人们需要的是精通税务的专家(Barry),而非即便智商高达300却需从零研读税法的数学天才(Mahesh)。
现有Agent恰似后者,若无专业背景与指导支持,在具体任务中难以达到理想表现。
更多AI大模型学习视频及资源,都在智泊AI。
2. 什么是"Agent Skills"?
问题解决方案:Anthropic 创新性地开发了 Agent Skills(智能体技能)框架。
核心定义:将程序性知识封装为标准化单元,其底层逻辑与文件夹结构一致。
模块组成:
提示词(Prompts)、执行脚本(Scripts)、配套说明文档
设计优势:
直观性:采用文件系统架构,天然适配Git版本控制、Google Drive协作等现有工作流
扩展性:支持通过代码脚本实现工具功能,利用代码的自文档化和可迭代特性,显著提升指令执行精度
3. 运作机制:节省上下文窗口
为避免Agent在掌握数百项技能时超出上下文窗口(Context Window)的容量限制,Anthropic创新性地引入了渐进式披露(Progressive Disclosure)机制。
该机制下,模型在初始运行阶段仅能访问技能的元数据(Metadata),待Agent主动调用特定技能后,才会进一步加载其完整指令与相关文件内容。
4. 蓬勃发展的生态系统
自发布以来,技能生态系统已形成三大核心类别:
基础技能
为Agent提供通用功能支持,包括Office文档处理及科研任务执行(例如生物信息学数据分析场景)。
合作伙伴技能
实现第三方工具的无缝整合。典型案例:Notion开发了帮助Claude深度解析工作区数据的技能;Browserbase则提供了浏览器自动化操作技能。
企业内部技能
当前发展最迅猛的领域。头部企业正通过定制化技能训练Agent,使其适配内部代码规范、操作专属软件或完成特定财务流程。
5. 面向未来的架构:MCP + Skills
Anthropic 提出了一种明确的通用智能体架构框架:
Agent Loop:负责调控模型的推理流程
Runtime 环境:集成文件管理与代码运行功能
MCP (Model Context Protocol):作为对接外部数据与工具的接口(实现系统与外部交互的核心通道)
Skills:封装领域专业知识库(智能体的认知储备)
该设计使得业务专家(如财务/法务人员)能够通过配置基础技能模块来增强AI的功能边界。
6. 终极愿景:自我进化的知识库
最让人期待的突破在于AI的进化能力。
Claude已具备自主创建技能的功能。例如,当它掌握了一项新任务(如撰写特定风格的PPT脚本),能够将该能力封装为可复用的"技能"模块。
这种机制使"经验积累"转化为实体化资产。通过持续的技能迭代,第30天的Claude将展现出远超初始版本的能力维度。
总结
演讲结尾通过计算机演进史构建了一个巧妙比喻:
模型 (Model) 如同 处理器 (Processor):具备惊人潜力却难以独立发挥作用。
Runtime/Agent 则类比 操作系统 (OS):核心职能在于资源协调与界面管理。
而 技能 (Skills) 恰似 应用程序 (Software):真正体现专业价值、实现具体功能的载体。
当前更应聚焦开发多元化的"应用程序"(Skills),而非重复构建基础"操作系统"(Agent)。
更多AI大模型学习视频及资源,都在智泊AI。