Anthropic Managed Agents 详细介绍
原文:Scaling Managed Agents: Decoupling the brain from the hands
🔍 核心概念
Managed Agents 是 Anthropic 在 Claude 平台上推出的托管服务,专门用于运行长周期(long-horizon)的 Agent 任务 。其核心设计理念是:将"大脑"(Claude 模型 + 调度逻辑)与"双手"(执行环境/工具)解耦,通过稳定的接口抽象,使系统能够适应未来模型能力的演进。
关键洞察
"Harnesses encode assumptions that go stale as models improve."
(调度器编码了关于"模型不能做什么"的假设,但这些假设会随着模型进步而过时)
例如:Claude Sonnet 4.5 曾因接近上下文限制而提前结束任务("上下文焦虑"),团队在调度器中添加了上下文重置逻辑。但当使用更强大的 Claude Opus 4.5 时,该行为已消失,之前的重置逻辑反而成了负担。
🏗️ 系统架构:三大核心抽象
受操作系统"虚拟化硬件"思想启发,Managed Agents 将 Agent 系统虚拟化为三个独立接口:
| 组件 | 职责 | 接口特点 |
|---|---|---|
| Session(会话) | 持久化存储所有事件的只追加日志(append-only log) | getEvents(), emitEvent() |
| Harness(调度器) | 调用 Claude、路由工具调用、管理 Agent 循环逻辑 | 无状态,可热替换 |
| Sandbox(沙箱) | Claude 执行代码、编辑文件的运行环境 | execute(name, input) → string |
┌─────────────────┐
│ Claude (Brain)│
│ + Harness │
└────────┬────────┘
│ tool calls
▼
┌─────────────────┐
│ Sandbox/Tools │
│ (Hands) │
└─────────────────┘
│
▼
┌─────────────────┐
│ Session Log │
│ (Durable State) │
└─────────────────┘
✅ 三大组件通过接口解耦,任一组件的实现可独立替换,不影响其他部分。
🔧 关键技术设计
1️⃣ 解耦"大脑"与"双手"
- 问题:早期将所有组件放在同一容器中,容器故障 = 会话丢失,且难以调试
- 方案 :
- 调度器(Harness)移出容器,通过
execute()调用沙箱 - 容器变为"牲口(cattle)":失败后可自动重建,无需人工干预
- 调度器本身也无状态:崩溃后可通过
wake(sessionId)从 Session 日志恢复
- 调度器(Harness)移出容器,通过
2️⃣ 安全边界设计
- 风险:若沙箱与凭证同容器,提示词注入可能窃取凭证
- 双重防护 :
- 资源级认证:如 Git 仓库,克隆时注入 token,沙箱内操作无需接触凭证
- 凭证保险库:自定义工具通过 MCP 协议 + 代理调用,凭证存储在外部 Vault,调度器本身也看不到凭证
3️⃣ Session ≠ 上下文窗口
- 挑战:长任务超出 Claude 上下文限制,传统压缩/裁剪会丢失关键信息
- 方案 :
- Session 作为外部持久化上下文对象,独立于模型上下文窗口
- 调度器通过
getEvents()灵活查询:按位置切片、回溯、重读 - 上下文转换逻辑放在调度器层,便于适配未来模型的上下文工程需求
4️⃣ 性能优化:多大脑 + 多双手
| 优化点 | 效果 |
|---|---|
| 按需启动沙箱 | 无需等待容器预置,推理可立即开始 |
| 无状态调度器 | 可水平扩展,轻松支持多并发会话 |
| 结果 | p50 TTFT(首 token 延迟)↓60%,p95 ↓90%+ |
🎯 适用场景
✅ 长周期复杂任务
- 代码库重构、多文件编辑
- 跨系统数据同步与迁移
- 自动化测试 + 修复循环
✅ 企业级集成
- 连接客户 VPC 内部资源(无需网络对等)
- 对接内部工具链、CI/CD 系统
- 合规审计:所有操作留痕于 Session 日志
✅ 高可靠性需求
- 会话状态持久化,支持断点续跑
- 组件故障自动恢复,无需人工介入
🚀 开始使用
- 访问 Claude Platform 文档
- 创建 Managed Agents 会话,配置所需工具/沙箱
- 通过 API 提交任务,系统自动调度执行
- 通过 Session 日志追踪执行过程与结果
💡 设计哲学总结
"How to design a system for programs as yet unthought of."
(如何为"尚未想到的程序"设计系统)
Managed Agents 的核心价值在于:
- 接口稳定:抽象出通用接口,适配未来模型与工具演进
- 实现灵活:调度策略、沙箱类型、存储后端均可替换
- 安全优先:凭证与执行环境物理隔离,最小权限原则
- 可观测性:所有事件持久化,支持审计与调试
这种"元调度器(meta-harness)"设计,使 Managed Agents 既能支持 Claude Code 等通用场景,也能适配垂直领域的定制化 Agent 流程,真正实现了面向未来的 Agent 基础设施。