在构建 AI 代理这件事上,我们正站在一个新的转折点上。传统的"大模型 + 外部逻辑"范式------由外部脚本控制规划、工具调用和记忆------正在让位于一种新的"模型原生"方式。模型不再只是被动执行命令,而是通过内化这些能力,真正学会如何像一个"智能体"那样行动、探索、纠错和成长。
Claude 的成长方式
Claude 之所以擅长做智能体,是因为它在训练阶段就被允许不断"实践当一个智能体"。它被放入开放性的任务中,自行判断要采取哪些步骤、使用哪些工具、如何探索环境,然后再给出结果。
这种开放式、多步骤的训练方式,让它不仅学会了"回答问题",更学会了"解决问题"。
强化学习在其中发挥了重要作用。Claude 在编码、搜索等任务上不断通过试错提升能力,学会在极少提示下优化行动策略。编码任务尤其关键------代码要求结构化思考、工具运用与验证,这种能力一旦形成,就能迁移到其他复杂任务上。正因为先把最难的事练到了极致,其他任务反而变得容易了。
写代码,是生成世界的一种方式
Claude 的能力,不止停留在写代码本身。
当它写一段 Python 脚本、运行脚本、生成一份 Excel 表时,这其实是在展示一种新的智能工作方式------通过代码去创造现实中的产物。
很多时候,这种方式比"直接生成结果"更高效。
写代码意味着自动化与复用。比如在做一个复杂的示意图时,让 Claude 直接写 SVG 文件可能很慢,但如果它改为写一段生成 SVG 的脚本,执行速度会快上几个数量级。Claude 甚至学会了在任务中权衡"直接产出"与"写脚本产出"的成本,就像一个真正理解效率的开发者。
Claude Code SDK:代理的通用骨架
如果要自己从头搭建一个代理系统,开发者得先写循环、实现工具调用、处理文件交互、对接 MCP 协议。
Claude Code SDK 把这些基础设施都打包好了。它提供了一个已经打磨完善的核心代理循环,开发者只需要在上面添加自己的业务逻辑和工具,就能构建一个可执行、可扩展的智能体。
虽然名字里带着"Code",但它的本质是一个通用代理框架。Claude Code SDK 不只是用来写程序,它可以执行任何形式的智能任务------搜索、规划、分析,甚至帮人安排行程。这个框架,让"让模型做事"变得像"调用函数"一样自然。
从 Claude MD 到 Skills:教模型学会"使用资源"
Claude MD 是一种为模型提供上下文的方式。
在项目中加入 Claude MD 文件,可以告诉模型项目结构、代码风格或习惯用法。
但 Skills 的出现,把这种能力扩展到了资源层面。
它不只是说明书,而是一整个"技能包"。里面可以放模板、脚本、素材、图片、演示文件,甚至可执行代码。Claude 不仅理解任务,还能直接使用资源去完成它。
这种机制让 Claude 变得像一个随时可以加载"模块"的多面手------给它一个模板,它就能做出标准化的文档;给它一个图标素材库,它就能自动组合出演示图;给它一段工具脚本,它就能主动调用执行。
这不是在教模型"怎么做",而是在给它"一整套做的能力"。
从工作流到代理回路
过去的 AI 系统靠预设的工作流推动:一个任务接一个任务、一步接一步执行。Claude 的到来,让这一切变得动态起来。
现在更有效的方式,是让模型自己在循环中行动------给它一个目标,它自行判断下一步、执行、验证、修正。这种代理回路的表现,远胜于传统的"串联提示词"。
而在更复杂的系统里,我们已经看到"由多个代理回路组成的工作流"出现:每一步都是一个独立的闭环。比如一个代理专门生成 SQL 查询并验证结果,另一个代理负责用这些结果画图。这样的系统不再依赖固定流程,而是由多个可自我修正的智能单元协作完成。
控制复杂性:可观测性与设计原则
代理越强大,系统就越复杂,也越难观测。
构建时应从最小闭环开始,优先实现简单、透明、可调试的结构。Claude Code SDK 就是这样的一个起点。
另一个关键设计原则,是让模型看到完整的上下文。
不要把工具接口拆得太细,而要按"用户界面"的逻辑组织:让模型像人一样,一眼看到关键内容,而不是需要调用三个不同接口才能拼出全貌。这样既减少调用次数,又提高理解效率。
多智能体:并行、协作与分工
当多个 Claude 协同工作时,智能体就进入了"多智能体"阶段。
主代理可以生成多个子代理,同时执行不同子任务。比如一个负责搜索资料,一个负责整理结果,一个负责生成最终报告。
这种并行结构让代理系统的速度和灵活性大幅提升。Claude 已经在内部产品中以这种方式工作------主控代理生成多个子代理同时执行搜索任务,然后整合结果返回用户。
子代理还可以起到上下文保护作用。当某个任务非常庞大、会占用大量 token 时,可以在子代理中完成,从而保护主代理的上下文空间。
在 Claude 看来,子代理就像一种特殊的"工具",它能传入提示,执行任务,再把结果返回。
Claude 也在学习如何成为"好的管理者"。刚开始,它也会犯"新经理的错"------给出的指令不清楚、上下文不足。随着训练,它学会了更清晰地布置任务,提供完整背景,让团队协作更高效。
实践与失败
多智能体系统的失败,往往源于过度设计。
太多代理互相通信,信息量爆炸,反而拖慢整体进展。这跟人类组织类似------规模越大,沟通成本越高,真正推动进展的人反而被掩盖在层层交流之下。
构建代理系统的关键,是保持节制与结构感:
从小做起、逐步扩展、保持可观测性。让每个智能体都知道自己该做什么、该交给谁,而不是陷入"无限会议"的循环。
构建者的建议
要从模型的视角思考:它看到的是什么?它能否从当前输入中解决问题?
经常回看日志、检查工具调用、确认模型的"视野"足够完整。
另外,工具设计要面向"体验"而不是"接口"。模型是使用者,不是程序。它需要的是结构清晰、内容完整的一次输入,而不是碎片化的 API 拼装。
未来六到十二个月
未来的代理系统将首先在可验证的领域普及,比如软件工程。
Claude 已经深刻改变了许多工程师的工作方式:从写代码、调试,到生成文档、搭建项目,代理正在成为日常工具的一部分。
接下来的一步,是让代理学会自我验证。
它不仅能写应用,还能打开、运行、测试,甚至自己修复 bug,形成完整的闭环。
随着"电脑操作(computer use)"能力的开放,这种闭环将进一步扩展。Claude 可以直接操作桌面和网页,自动整理文档、修改表格、回复评论。不再需要复制粘贴,而是在你工作的地方,和你一起工作。
尾声
AI 代理的演进,不再是让模型回答问题,而是让它学会行动。
Claude 的方向,正是把编码、推理、规划、协作和验证融为一体,让智能体真正成为可以独立完成任务的数字合作者。
未来,我们与模型之间的界限将越来越模糊。它不再是工具,而更像一个共事者。