《Anthropic:Building more effective AI agents》

原视频

在构建 AI 代理这件事上,我们正站在一个新的转折点上。传统的"大模型 + 外部逻辑"范式------由外部脚本控制规划、工具调用和记忆------正在让位于一种新的"模型原生"方式。模型不再只是被动执行命令,而是通过内化这些能力,真正学会如何像一个"智能体"那样行动、探索、纠错和成长。


Claude 的成长方式

Claude 之所以擅长做智能体,是因为它在训练阶段就被允许不断"实践当一个智能体"。它被放入开放性的任务中,自行判断要采取哪些步骤、使用哪些工具、如何探索环境,然后再给出结果。

这种开放式、多步骤的训练方式,让它不仅学会了"回答问题",更学会了"解决问题"。

强化学习在其中发挥了重要作用。Claude 在编码、搜索等任务上不断通过试错提升能力,学会在极少提示下优化行动策略。编码任务尤其关键------代码要求结构化思考、工具运用与验证,这种能力一旦形成,就能迁移到其他复杂任务上。正因为先把最难的事练到了极致,其他任务反而变得容易了。


写代码,是生成世界的一种方式

Claude 的能力,不止停留在写代码本身。

当它写一段 Python 脚本、运行脚本、生成一份 Excel 表时,这其实是在展示一种新的智能工作方式------通过代码去创造现实中的产物。

很多时候,这种方式比"直接生成结果"更高效。

写代码意味着自动化与复用。比如在做一个复杂的示意图时,让 Claude 直接写 SVG 文件可能很慢,但如果它改为写一段生成 SVG 的脚本,执行速度会快上几个数量级。Claude 甚至学会了在任务中权衡"直接产出"与"写脚本产出"的成本,就像一个真正理解效率的开发者。


Claude Code SDK:代理的通用骨架

如果要自己从头搭建一个代理系统,开发者得先写循环、实现工具调用、处理文件交互、对接 MCP 协议。

Claude Code SDK 把这些基础设施都打包好了。它提供了一个已经打磨完善的核心代理循环,开发者只需要在上面添加自己的业务逻辑和工具,就能构建一个可执行、可扩展的智能体。

虽然名字里带着"Code",但它的本质是一个通用代理框架。Claude Code SDK 不只是用来写程序,它可以执行任何形式的智能任务------搜索、规划、分析,甚至帮人安排行程。这个框架,让"让模型做事"变得像"调用函数"一样自然。


从 Claude MD 到 Skills:教模型学会"使用资源"

Claude MD 是一种为模型提供上下文的方式。

在项目中加入 Claude MD 文件,可以告诉模型项目结构、代码风格或习惯用法。

但 Skills 的出现,把这种能力扩展到了资源层面。

它不只是说明书,而是一整个"技能包"。里面可以放模板、脚本、素材、图片、演示文件,甚至可执行代码。Claude 不仅理解任务,还能直接使用资源去完成它。

这种机制让 Claude 变得像一个随时可以加载"模块"的多面手------给它一个模板,它就能做出标准化的文档;给它一个图标素材库,它就能自动组合出演示图;给它一段工具脚本,它就能主动调用执行。

这不是在教模型"怎么做",而是在给它"一整套做的能力"。


从工作流到代理回路

过去的 AI 系统靠预设的工作流推动:一个任务接一个任务、一步接一步执行。Claude 的到来,让这一切变得动态起来。

现在更有效的方式,是让模型自己在循环中行动------给它一个目标,它自行判断下一步、执行、验证、修正。这种代理回路的表现,远胜于传统的"串联提示词"。

而在更复杂的系统里,我们已经看到"由多个代理回路组成的工作流"出现:每一步都是一个独立的闭环。比如一个代理专门生成 SQL 查询并验证结果,另一个代理负责用这些结果画图。这样的系统不再依赖固定流程,而是由多个可自我修正的智能单元协作完成。


控制复杂性:可观测性与设计原则

代理越强大,系统就越复杂,也越难观测。

构建时应从最小闭环开始,优先实现简单、透明、可调试的结构。Claude Code SDK 就是这样的一个起点。

另一个关键设计原则,是让模型看到完整的上下文。

不要把工具接口拆得太细,而要按"用户界面"的逻辑组织:让模型像人一样,一眼看到关键内容,而不是需要调用三个不同接口才能拼出全貌。这样既减少调用次数,又提高理解效率。


多智能体:并行、协作与分工

当多个 Claude 协同工作时,智能体就进入了"多智能体"阶段。

主代理可以生成多个子代理,同时执行不同子任务。比如一个负责搜索资料,一个负责整理结果,一个负责生成最终报告。

这种并行结构让代理系统的速度和灵活性大幅提升。Claude 已经在内部产品中以这种方式工作------主控代理生成多个子代理同时执行搜索任务,然后整合结果返回用户。

子代理还可以起到上下文保护作用。当某个任务非常庞大、会占用大量 token 时,可以在子代理中完成,从而保护主代理的上下文空间。

在 Claude 看来,子代理就像一种特殊的"工具",它能传入提示,执行任务,再把结果返回。

Claude 也在学习如何成为"好的管理者"。刚开始,它也会犯"新经理的错"------给出的指令不清楚、上下文不足。随着训练,它学会了更清晰地布置任务,提供完整背景,让团队协作更高效。


实践与失败

多智能体系统的失败,往往源于过度设计。

太多代理互相通信,信息量爆炸,反而拖慢整体进展。这跟人类组织类似------规模越大,沟通成本越高,真正推动进展的人反而被掩盖在层层交流之下。

构建代理系统的关键,是保持节制与结构感:

从小做起、逐步扩展、保持可观测性。让每个智能体都知道自己该做什么、该交给谁,而不是陷入"无限会议"的循环。


构建者的建议

要从模型的视角思考:它看到的是什么?它能否从当前输入中解决问题?

经常回看日志、检查工具调用、确认模型的"视野"足够完整。

另外,工具设计要面向"体验"而不是"接口"。模型是使用者,不是程序。它需要的是结构清晰、内容完整的一次输入,而不是碎片化的 API 拼装。


未来六到十二个月

未来的代理系统将首先在可验证的领域普及,比如软件工程。

Claude 已经深刻改变了许多工程师的工作方式:从写代码、调试,到生成文档、搭建项目,代理正在成为日常工具的一部分。

接下来的一步,是让代理学会自我验证。

它不仅能写应用,还能打开、运行、测试,甚至自己修复 bug,形成完整的闭环。

随着"电脑操作(computer use)"能力的开放,这种闭环将进一步扩展。Claude 可以直接操作桌面和网页,自动整理文档、修改表格、回复评论。不再需要复制粘贴,而是在你工作的地方,和你一起工作。


尾声

AI 代理的演进,不再是让模型回答问题,而是让它学会行动。

Claude 的方向,正是把编码、推理、规划、协作和验证融为一体,让智能体真正成为可以独立完成任务的数字合作者。

未来,我们与模型之间的界限将越来越模糊。它不再是工具,而更像一个共事者。

相关推荐
非专业程序员8 小时前
Vibe Coding 实战!花了两天时间,让 AI 写了一个富文本渲染引擎!
ai编程·claude
知了一笑9 小时前
AI时代,不被淘汰的开发者,都有这三种能力
chatgpt·ai编程·claude·cursor
非专业程序员Ping19 小时前
Vibe Coding 实战!花了两天时间,让 AI 写了一个富文本渲染引擎!
ios·ai·swift·claude·vibecoding
狠活科技1 天前
Claude Code 重大更新:支持一键原生安装,彻底别了 Node.js
人工智能·aigc·ai编程·claude·claude code
yaocheng的ai分身1 天前
AI吞噬软件
claude
yaocheng的ai分身3 天前
【转载】我如何用Superpowers MCP强制Claude Code在编码前进行规划
ai编程·claude
coder_pig3 天前
Cursor Agents + Holopix AI | 轻松实现 "🐦坤坤" 自走棋小游戏
aigc·claude·cursor
小溪彼岸4 天前
Claude Code上线插件系统,AI编程模式再次升级
aigc·claude
小溪彼岸4 天前
如何从零开始创建一个Claude Code插件
claude
阿然1658 天前
我如何使用 Claude Code 的每一个功能
人工智能·ai编程·claude