Anthropic 把“AI团队管理“变成了一键服务:Claude Managed Agents解读

以前搭一个能上线的AI Agent要几个月,现在几行代码就搞定了。


先搞懂一个公式

2026年初,AI圈流传着一个简洁的公式:

Agent = Model + Harness

Model(模型) 提供智能------能思考、能推理、能生成。

Harness(缰绳) 让这个智能能真正干活------在哪里跑、用什么工具、出了错怎么办。

打个比方:

Model 是一匹千里马,Harness 是马鞍、缰绳和赛道。 没有 Harness,千里马只能在草地上乱跑;有了 Harness,它才能赢比赛。

问题是 :搭一套生产级的 Harness,需要处理沙箱执行、状态管理、权限控制、端到端追踪......这些基础设施工作可能耗费数月

昨天,Anthropic 说:这些活儿我们全包了。


Claude Managed Agents:到底是什么?

一句话概括: 你定义AI要干什么,Anthropic负责让它跑起来。

以前 vs 现在

以前(自己搭) 现在(Managed Agents)
自己搭沙箱环境 平台提供安全沙箱
自己写状态管理 内置检查点机制
自己做权限控制 作用域权限已内置
自己处理错误恢复 自动从错误中恢复
几个月才能上线 几行代码就能跑

四个核心能力

1. 生产级 Agent

安全沙箱、身份验证、工具执行------全部由平台处理

开发者不需要自己搭基础设施,专注于定义Agent该干什么就行。

2. 长运行会话

Agent可以自主工作数小时,不是几分钟的简单问答。

进度和输出会持久化保存,即使连接断开也不会丢失状态

就像你给员工布置了一个大项目, 他不会因为你关了办公室的门就停下来。

3. 多Agent协调

一个主Agent可以派生多个子Agent,分别处理不同子任务,然后汇总结果。

就像项目经理把大任务拆成小任务, 分给不同组员并行处理,最后合并交付。

4. 可信治理

Agent访问真实系统时,权限管理、身份验证、执行追踪全部内置

企业最担心的问题------Agent越权访问敏感数据------有了系统性的解决方案。


底层设计:三个关键模式

Anthropic在设计这套系统时,遵循了三个核心思路。听起来像技术细节,但其实很好理解。

模式一:用AI已经擅长的工具

Claude在SWE-bench测试中拿到49%的成绩,当时的最先进水平。

用的工具只有两个:bash 和 文本编辑器。

这两个工具看起来很"原始",但关键在于:Claude对它们理解极深

就像给一个大厨一把好刀和一口好锅, 他能做出千变万化的菜------不需要108种厨具。

Anthropic发现,Claude能把这些通用工具组合出各种解决方案:

  • Agent Skills = bash + 文本编辑器的组合

  • 编程式工具调用 = bash脚本串联

  • 内存工具 = 文件读写的巧妙运用

设计哲学:给AI它已经精通的通用工具,让它自己组合出解决方案。

模式二:让AI自己做决策

传统做法:AI每调用一个工具,结果都要经过"大脑"处理,然后再决定下一步。

问题是:很多中间结果根本不需要"过脑子",直接传给下一个工具就行了。每次都要处理,又慢又费钱。

Managed Agents的做法:

给AI一个代码执行工具,让AI自己写代码来编排工具调用。 AI自己决定哪些结果需要仔细看、哪些可以直接跳过。 只有最终输出才进入AI的"大脑"。

效果有多好?在BrowseComp测试中,让AI自己过滤工具输出后,准确率从45.3%飙升到61.6%

核心洞察:强大的编码模型,也是强大的通用Agent。

模式三:该管的地方严格管

AI能力越强,安全边界越重要。

Managed Agents的安全设计逻辑:

操作类型 处理方式
可逆操作(编辑文件) AI自主执行,但带过期检查
不可逆操作(调用外部API) 需要用户确认
高风险操作 第二个AI审查后才放行

就像公司里的审批流程: 买个文具自己批就行,签个大合同要领导签字。


这件事为什么重要?

1. Anthropic变了

以前:我提供模型,你自己搭基础设施。 现在:我提供整套运行环境,你专注于定义Agent该干什么。

Anthropic开始做云服务商做的事------提供计算资源和运行环境,只不过跑在上面的是AI Agent。

2. 从原型到生产的"死亡谷"消失了

很多开发者都有这个痛苦:

go 复制代码
ounter(lineDemo很酷 → 上线很难 → 基础设施搞死人 → 项目烂尾

Managed Agents把中间那段最痛苦的基础设施工作接管了。

3. Agent的"工业化"时代来了

阶段 特征
2023-2024 手工作坊:每个Agent都是定制开发
2025 工具链成熟:框架和库越来越多
2026 工业化生产:基础设施即服务

给开发者的启示

1. 基础设施不再是瓶颈

当沙箱、状态管理、权限控制都有人帮你做了,你该把精力放在哪?

设计Agent能做什么、怎么做、边界在哪里。

2. "用AI已经擅长的工具"是通用原则

不要为每个任务设计专用工具。

给AI通用工具,让它自己组合------这个思路不只适用于Anthropic,适用于所有AI应用开发。

3. 安全边界要从第一天就设计

不是"先跑起来再加安全",而是安全是架构的一部分

Managed Agents在这方面做了很好的示范。

4. 关注"Agent即服务"赛道

Anthropic带了个头,但不会是唯一一个。

预计Google、OpenAI、以及国内的大模型厂商,都会推出类似的托管Agent服务。


参考链接

资源 链接
Claude Managed Agents 官方博客 https://claude.com/blog/claude-managed-agents
相关推荐
云程笔记2 小时前
021.损失函数深度解读:YOLO的定位、置信度、分类损失计算
人工智能·yolo·机器学习·计算机视觉·分类·数据挖掘
小二·2 小时前
2026年4月技术前沿:AI大模型爆发、智能体革命与量子安全新纪元
人工智能·安全
w2sfot2 小时前
反AI逆向JS加密
javascript·人工智能·反ai
独隅2 小时前
PyTorch 分布式训练完整指南:策略、实现与模型选型
人工智能·pytorch·分布式
冷色系里的一抹暖调2 小时前
OpenClaw Docker 部署避坑指南:服务启动成功但网页打不开?
人工智能·windows·docker·ai·容器·opencode
沪漂阿龙2 小时前
卷积神经网络(CNN)零基础通关指南:原理、图解与PyTorch实战
人工智能·pytorch·cnn
Data-Miner2 小时前
54页可编辑PPT | 数据中台建设方案汇报
大数据·人工智能
语戚2 小时前
深度解析:Stable Diffusion 底层原理 + U-Net Denoise 去噪机制全拆解
人工智能·ai·stable diffusion·aigc·模型
舒一笑2 小时前
AI 时代最火的新岗位,不是提示词工程师,而是 Harness 工程师
人工智能·程序员·设计