《Anthropic：Building more effective AI agents》

原视频

在构建 AI 代理这件事上，我们正站在一个新的转折点上。传统的"大模型 + 外部逻辑"范式------由外部脚本控制规划、工具调用和记忆------正在让位于一种新的"模型原生"方式。模型不再只是被动执行命令，而是通过内化这些能力，真正学会如何像一个"智能体"那样行动、探索、纠错和成长。

Claude 的成长方式

Claude 之所以擅长做智能体，是因为它在训练阶段就被允许不断"实践当一个智能体"。它被放入开放性的任务中，自行判断要采取哪些步骤、使用哪些工具、如何探索环境，然后再给出结果。

这种开放式、多步骤的训练方式，让它不仅学会了"回答问题"，更学会了"解决问题"。

强化学习在其中发挥了重要作用。Claude 在编码、搜索等任务上不断通过试错提升能力，学会在极少提示下优化行动策略。编码任务尤其关键------代码要求结构化思考、工具运用与验证，这种能力一旦形成，就能迁移到其他复杂任务上。正因为先把最难的事练到了极致，其他任务反而变得容易了。

写代码，是生成世界的一种方式

Claude 的能力，不止停留在写代码本身。

当它写一段 Python 脚本、运行脚本、生成一份 Excel 表时，这其实是在展示一种新的智能工作方式------通过代码去创造现实中的产物。

很多时候，这种方式比"直接生成结果"更高效。

写代码意味着自动化与复用。比如在做一个复杂的示意图时，让 Claude 直接写 SVG 文件可能很慢，但如果它改为写一段生成 SVG 的脚本，执行速度会快上几个数量级。Claude 甚至学会了在任务中权衡"直接产出"与"写脚本产出"的成本，就像一个真正理解效率的开发者。

Claude Code SDK：代理的通用骨架

如果要自己从头搭建一个代理系统，开发者得先写循环、实现工具调用、处理文件交互、对接 MCP 协议。

Claude Code SDK 把这些基础设施都打包好了。它提供了一个已经打磨完善的核心代理循环，开发者只需要在上面添加自己的业务逻辑和工具，就能构建一个可执行、可扩展的智能体。

虽然名字里带着"Code"，但它的本质是一个通用代理框架。Claude Code SDK 不只是用来写程序，它可以执行任何形式的智能任务------搜索、规划、分析，甚至帮人安排行程。这个框架，让"让模型做事"变得像"调用函数"一样自然。

从 Claude MD 到 Skills：教模型学会"使用资源"

Claude MD 是一种为模型提供上下文的方式。

在项目中加入 Claude MD 文件，可以告诉模型项目结构、代码风格或习惯用法。

但 Skills 的出现，把这种能力扩展到了资源层面。

它不只是说明书，而是一整个"技能包"。里面可以放模板、脚本、素材、图片、演示文件，甚至可执行代码。Claude 不仅理解任务，还能直接使用资源去完成它。

这种机制让 Claude 变得像一个随时可以加载"模块"的多面手------给它一个模板，它就能做出标准化的文档；给它一个图标素材库，它就能自动组合出演示图；给它一段工具脚本，它就能主动调用执行。

这不是在教模型"怎么做"，而是在给它"一整套做的能力"。

从工作流到代理回路

过去的 AI 系统靠预设的工作流推动：一个任务接一个任务、一步接一步执行。Claude 的到来，让这一切变得动态起来。

现在更有效的方式，是让模型自己在循环中行动------给它一个目标，它自行判断下一步、执行、验证、修正。这种代理回路的表现，远胜于传统的"串联提示词"。

而在更复杂的系统里，我们已经看到"由多个代理回路组成的工作流"出现：每一步都是一个独立的闭环。比如一个代理专门生成 SQL 查询并验证结果，另一个代理负责用这些结果画图。这样的系统不再依赖固定流程，而是由多个可自我修正的智能单元协作完成。

控制复杂性：可观测性与设计原则

代理越强大，系统就越复杂，也越难观测。

构建时应从最小闭环开始，优先实现简单、透明、可调试的结构。Claude Code SDK 就是这样的一个起点。

另一个关键设计原则，是让模型看到完整的上下文。

不要把工具接口拆得太细，而要按"用户界面"的逻辑组织：让模型像人一样，一眼看到关键内容，而不是需要调用三个不同接口才能拼出全貌。这样既减少调用次数，又提高理解效率。

多智能体：并行、协作与分工

当多个 Claude 协同工作时，智能体就进入了"多智能体"阶段。

主代理可以生成多个子代理，同时执行不同子任务。比如一个负责搜索资料，一个负责整理结果，一个负责生成最终报告。

这种并行结构让代理系统的速度和灵活性大幅提升。Claude 已经在内部产品中以这种方式工作------主控代理生成多个子代理同时执行搜索任务，然后整合结果返回用户。

子代理还可以起到上下文保护作用。当某个任务非常庞大、会占用大量 token 时，可以在子代理中完成，从而保护主代理的上下文空间。

在 Claude 看来，子代理就像一种特殊的"工具"，它能传入提示，执行任务，再把结果返回。

Claude 也在学习如何成为"好的管理者"。刚开始，它也会犯"新经理的错"------给出的指令不清楚、上下文不足。随着训练，它学会了更清晰地布置任务，提供完整背景，让团队协作更高效。

实践与失败

多智能体系统的失败，往往源于过度设计。

太多代理互相通信，信息量爆炸，反而拖慢整体进展。这跟人类组织类似------规模越大，沟通成本越高，真正推动进展的人反而被掩盖在层层交流之下。

构建代理系统的关键，是保持节制与结构感：

从小做起、逐步扩展、保持可观测性。让每个智能体都知道自己该做什么、该交给谁，而不是陷入"无限会议"的循环。

构建者的建议

要从模型的视角思考：它看到的是什么？它能否从当前输入中解决问题？

经常回看日志、检查工具调用、确认模型的"视野"足够完整。

另外，工具设计要面向"体验"而不是"接口"。模型是使用者，不是程序。它需要的是结构清晰、内容完整的一次输入，而不是碎片化的 API 拼装。

未来六到十二个月

未来的代理系统将首先在可验证的领域普及，比如软件工程。

Claude 已经深刻改变了许多工程师的工作方式：从写代码、调试，到生成文档、搭建项目，代理正在成为日常工具的一部分。

接下来的一步，是让代理学会自我验证。

它不仅能写应用，还能打开、运行、测试，甚至自己修复 bug，形成完整的闭环。

随着"电脑操作（computer use）"能力的开放，这种闭环将进一步扩展。Claude 可以直接操作桌面和网页，自动整理文档、修改表格、回复评论。不再需要复制粘贴，而是在你工作的地方，和你一起工作。

尾声

AI 代理的演进，不再是让模型回答问题，而是让它学会行动。

Claude 的方向，正是把编码、推理、规划、协作和验证融为一体，让智能体真正成为可以独立完成任务的数字合作者。

未来，我们与模型之间的界限将越来越模糊。它不再是工具，而更像一个共事者。