《Anthropic:Building more effective AI agents》

原视频

在构建 AI 代理这件事上,我们正站在一个新的转折点上。传统的"大模型 + 外部逻辑"范式------由外部脚本控制规划、工具调用和记忆------正在让位于一种新的"模型原生"方式。模型不再只是被动执行命令,而是通过内化这些能力,真正学会如何像一个"智能体"那样行动、探索、纠错和成长。


Claude 的成长方式

Claude 之所以擅长做智能体,是因为它在训练阶段就被允许不断"实践当一个智能体"。它被放入开放性的任务中,自行判断要采取哪些步骤、使用哪些工具、如何探索环境,然后再给出结果。

这种开放式、多步骤的训练方式,让它不仅学会了"回答问题",更学会了"解决问题"。

强化学习在其中发挥了重要作用。Claude 在编码、搜索等任务上不断通过试错提升能力,学会在极少提示下优化行动策略。编码任务尤其关键------代码要求结构化思考、工具运用与验证,这种能力一旦形成,就能迁移到其他复杂任务上。正因为先把最难的事练到了极致,其他任务反而变得容易了。


写代码,是生成世界的一种方式

Claude 的能力,不止停留在写代码本身。

当它写一段 Python 脚本、运行脚本、生成一份 Excel 表时,这其实是在展示一种新的智能工作方式------通过代码去创造现实中的产物。

很多时候,这种方式比"直接生成结果"更高效。

写代码意味着自动化与复用。比如在做一个复杂的示意图时,让 Claude 直接写 SVG 文件可能很慢,但如果它改为写一段生成 SVG 的脚本,执行速度会快上几个数量级。Claude 甚至学会了在任务中权衡"直接产出"与"写脚本产出"的成本,就像一个真正理解效率的开发者。


Claude Code SDK:代理的通用骨架

如果要自己从头搭建一个代理系统,开发者得先写循环、实现工具调用、处理文件交互、对接 MCP 协议。

Claude Code SDK 把这些基础设施都打包好了。它提供了一个已经打磨完善的核心代理循环,开发者只需要在上面添加自己的业务逻辑和工具,就能构建一个可执行、可扩展的智能体。

虽然名字里带着"Code",但它的本质是一个通用代理框架。Claude Code SDK 不只是用来写程序,它可以执行任何形式的智能任务------搜索、规划、分析,甚至帮人安排行程。这个框架,让"让模型做事"变得像"调用函数"一样自然。


从 Claude MD 到 Skills:教模型学会"使用资源"

Claude MD 是一种为模型提供上下文的方式。

在项目中加入 Claude MD 文件,可以告诉模型项目结构、代码风格或习惯用法。

但 Skills 的出现,把这种能力扩展到了资源层面。

它不只是说明书,而是一整个"技能包"。里面可以放模板、脚本、素材、图片、演示文件,甚至可执行代码。Claude 不仅理解任务,还能直接使用资源去完成它。

这种机制让 Claude 变得像一个随时可以加载"模块"的多面手------给它一个模板,它就能做出标准化的文档;给它一个图标素材库,它就能自动组合出演示图;给它一段工具脚本,它就能主动调用执行。

这不是在教模型"怎么做",而是在给它"一整套做的能力"。


从工作流到代理回路

过去的 AI 系统靠预设的工作流推动:一个任务接一个任务、一步接一步执行。Claude 的到来,让这一切变得动态起来。

现在更有效的方式,是让模型自己在循环中行动------给它一个目标,它自行判断下一步、执行、验证、修正。这种代理回路的表现,远胜于传统的"串联提示词"。

而在更复杂的系统里,我们已经看到"由多个代理回路组成的工作流"出现:每一步都是一个独立的闭环。比如一个代理专门生成 SQL 查询并验证结果,另一个代理负责用这些结果画图。这样的系统不再依赖固定流程,而是由多个可自我修正的智能单元协作完成。


控制复杂性:可观测性与设计原则

代理越强大,系统就越复杂,也越难观测。

构建时应从最小闭环开始,优先实现简单、透明、可调试的结构。Claude Code SDK 就是这样的一个起点。

另一个关键设计原则,是让模型看到完整的上下文。

不要把工具接口拆得太细,而要按"用户界面"的逻辑组织:让模型像人一样,一眼看到关键内容,而不是需要调用三个不同接口才能拼出全貌。这样既减少调用次数,又提高理解效率。


多智能体:并行、协作与分工

当多个 Claude 协同工作时,智能体就进入了"多智能体"阶段。

主代理可以生成多个子代理,同时执行不同子任务。比如一个负责搜索资料,一个负责整理结果,一个负责生成最终报告。

这种并行结构让代理系统的速度和灵活性大幅提升。Claude 已经在内部产品中以这种方式工作------主控代理生成多个子代理同时执行搜索任务,然后整合结果返回用户。

子代理还可以起到上下文保护作用。当某个任务非常庞大、会占用大量 token 时,可以在子代理中完成,从而保护主代理的上下文空间。

在 Claude 看来,子代理就像一种特殊的"工具",它能传入提示,执行任务,再把结果返回。

Claude 也在学习如何成为"好的管理者"。刚开始,它也会犯"新经理的错"------给出的指令不清楚、上下文不足。随着训练,它学会了更清晰地布置任务,提供完整背景,让团队协作更高效。


实践与失败

多智能体系统的失败,往往源于过度设计。

太多代理互相通信,信息量爆炸,反而拖慢整体进展。这跟人类组织类似------规模越大,沟通成本越高,真正推动进展的人反而被掩盖在层层交流之下。

构建代理系统的关键,是保持节制与结构感:

从小做起、逐步扩展、保持可观测性。让每个智能体都知道自己该做什么、该交给谁,而不是陷入"无限会议"的循环。


构建者的建议

要从模型的视角思考:它看到的是什么?它能否从当前输入中解决问题?

经常回看日志、检查工具调用、确认模型的"视野"足够完整。

另外,工具设计要面向"体验"而不是"接口"。模型是使用者,不是程序。它需要的是结构清晰、内容完整的一次输入,而不是碎片化的 API 拼装。


未来六到十二个月

未来的代理系统将首先在可验证的领域普及,比如软件工程。

Claude 已经深刻改变了许多工程师的工作方式:从写代码、调试,到生成文档、搭建项目,代理正在成为日常工具的一部分。

接下来的一步,是让代理学会自我验证。

它不仅能写应用,还能打开、运行、测试,甚至自己修复 bug,形成完整的闭环。

随着"电脑操作(computer use)"能力的开放,这种闭环将进一步扩展。Claude 可以直接操作桌面和网页,自动整理文档、修改表格、回复评论。不再需要复制粘贴,而是在你工作的地方,和你一起工作。


尾声

AI 代理的演进,不再是让模型回答问题,而是让它学会行动。

Claude 的方向,正是把编码、推理、规划、协作和验证融为一体,让智能体真正成为可以独立完成任务的数字合作者。

未来,我们与模型之间的界限将越来越模糊。它不再是工具,而更像一个共事者。

相关推荐
小姐姐味道6 小时前
Claude Skills:被过度吹嘘的的概念翻新!
后端·github·claude
飞哥数智坊8 小时前
Claude Skills 自定义实战:提炼会议纪要并推送企业微信
人工智能·claude·chatglm (智谱)
佛喜酱的AI实践1 天前
告别传统RAG:用Claude Code 构建本地知识库
ai编程·claude
骑猪兜风2332 天前
Claude 新功能 Skills 横空出世,比 MCP 更高效的 AI 增强方案!
ai编程·claude·mcp
小溪彼岸2 天前
分享一个Claude Code宝藏网站Claude Code Templates
aigc·claude
yaocheng的ai分身2 天前
Claude Code 版本 2.0.14
claude
yaocheng的ai分身2 天前
Claude Code 网页版发布
claude
飞哥数智坊2 天前
Claude Skills 实测体验:不用翻墙,GLM-4.6 也能玩转
人工智能·claude·chatglm (智谱)
yaocheng的ai分身3 天前
【simonwillison】Claude Skills 很棒,可能比 MCP 更重要
claude