以前搭一个能上线的AI Agent要几个月,现在几行代码就搞定了。
先搞懂一个公式
2026年初,AI圈流传着一个简洁的公式:
Agent = Model + Harness
Model(模型) 提供智能------能思考、能推理、能生成。
Harness(缰绳) 让这个智能能真正干活------在哪里跑、用什么工具、出了错怎么办。
打个比方:
Model 是一匹千里马,Harness 是马鞍、缰绳和赛道。 没有 Harness,千里马只能在草地上乱跑;有了 Harness,它才能赢比赛。
问题是 :搭一套生产级的 Harness,需要处理沙箱执行、状态管理、权限控制、端到端追踪......这些基础设施工作可能耗费数月。
昨天,Anthropic 说:这些活儿我们全包了。
Claude Managed Agents:到底是什么?
一句话概括: 你定义AI要干什么,Anthropic负责让它跑起来。
以前 vs 现在
| 以前(自己搭) | 现在(Managed Agents) |
|---|---|
| 自己搭沙箱环境 | 平台提供安全沙箱 |
| 自己写状态管理 | 内置检查点机制 |
| 自己做权限控制 | 作用域权限已内置 |
| 自己处理错误恢复 | 自动从错误中恢复 |
| 几个月才能上线 | 几行代码就能跑 |
四个核心能力
1. 生产级 Agent
安全沙箱、身份验证、工具执行------全部由平台处理。
开发者不需要自己搭基础设施,专注于定义Agent该干什么就行。
2. 长运行会话
Agent可以自主工作数小时,不是几分钟的简单问答。
进度和输出会持久化保存,即使连接断开也不会丢失状态。
就像你给员工布置了一个大项目, 他不会因为你关了办公室的门就停下来。
3. 多Agent协调
一个主Agent可以派生多个子Agent,分别处理不同子任务,然后汇总结果。
就像项目经理把大任务拆成小任务, 分给不同组员并行处理,最后合并交付。
4. 可信治理
Agent访问真实系统时,权限管理、身份验证、执行追踪全部内置。
企业最担心的问题------Agent越权访问敏感数据------有了系统性的解决方案。
底层设计:三个关键模式
Anthropic在设计这套系统时,遵循了三个核心思路。听起来像技术细节,但其实很好理解。
模式一:用AI已经擅长的工具
Claude在SWE-bench测试中拿到49%的成绩,当时的最先进水平。
用的工具只有两个:bash 和 文本编辑器。
这两个工具看起来很"原始",但关键在于:Claude对它们理解极深。
就像给一个大厨一把好刀和一口好锅, 他能做出千变万化的菜------不需要108种厨具。
Anthropic发现,Claude能把这些通用工具组合出各种解决方案:
-
Agent Skills = bash + 文本编辑器的组合
-
编程式工具调用 = bash脚本串联
-
内存工具 = 文件读写的巧妙运用
设计哲学:给AI它已经精通的通用工具,让它自己组合出解决方案。
模式二:让AI自己做决策
传统做法:AI每调用一个工具,结果都要经过"大脑"处理,然后再决定下一步。
问题是:很多中间结果根本不需要"过脑子",直接传给下一个工具就行了。每次都要处理,又慢又费钱。
Managed Agents的做法:
给AI一个代码执行工具,让AI自己写代码来编排工具调用。 AI自己决定哪些结果需要仔细看、哪些可以直接跳过。 只有最终输出才进入AI的"大脑"。
效果有多好?在BrowseComp测试中,让AI自己过滤工具输出后,准确率从45.3%飙升到61.6%。
核心洞察:强大的编码模型,也是强大的通用Agent。
模式三:该管的地方严格管
AI能力越强,安全边界越重要。
Managed Agents的安全设计逻辑:
| 操作类型 | 处理方式 |
|---|---|
| 可逆操作(编辑文件) | AI自主执行,但带过期检查 |
| 不可逆操作(调用外部API) | 需要用户确认 |
| 高风险操作 | 第二个AI审查后才放行 |
就像公司里的审批流程: 买个文具自己批就行,签个大合同要领导签字。
这件事为什么重要?
1. Anthropic变了
以前:我提供模型,你自己搭基础设施。 现在:我提供整套运行环境,你专注于定义Agent该干什么。
Anthropic开始做云服务商做的事------提供计算资源和运行环境,只不过跑在上面的是AI Agent。
2. 从原型到生产的"死亡谷"消失了
很多开发者都有这个痛苦:
go
ounter(lineDemo很酷 → 上线很难 → 基础设施搞死人 → 项目烂尾
Managed Agents把中间那段最痛苦的基础设施工作接管了。
3. Agent的"工业化"时代来了
| 阶段 | 特征 |
|---|---|
| 2023-2024 | 手工作坊:每个Agent都是定制开发 |
| 2025 | 工具链成熟:框架和库越来越多 |
| 2026 | 工业化生产:基础设施即服务 |
给开发者的启示
1. 基础设施不再是瓶颈
当沙箱、状态管理、权限控制都有人帮你做了,你该把精力放在哪?
设计Agent能做什么、怎么做、边界在哪里。
2. "用AI已经擅长的工具"是通用原则
不要为每个任务设计专用工具。
给AI通用工具,让它自己组合------这个思路不只适用于Anthropic,适用于所有AI应用开发。
3. 安全边界要从第一天就设计
不是"先跑起来再加安全",而是安全是架构的一部分。
Managed Agents在这方面做了很好的示范。
4. 关注"Agent即服务"赛道
Anthropic带了个头,但不会是唯一一个。
预计Google、OpenAI、以及国内的大模型厂商,都会推出类似的托管Agent服务。
参考链接
| 资源 | 链接 |
|---|---|
| Claude Managed Agents 官方博客 | https://claude.com/blog/claude-managed-agents |