Anthropic Managed Agents 详细介绍

原文：Scaling Managed Agents: Decoupling the brain from the hands

🔍 核心概念

Managed Agents 是 Anthropic 在 Claude 平台上推出的托管服务，专门用于运行长周期（long-horizon）的 Agent 任务 。其核心设计理念是：将"大脑"（Claude 模型 + 调度逻辑）与"双手"（执行环境/工具）解耦，通过稳定的接口抽象，使系统能够适应未来模型能力的演进。

关键洞察

"Harnesses encode assumptions that go stale as models improve."

（调度器编码了关于"模型不能做什么"的假设，但这些假设会随着模型进步而过时）

例如：Claude Sonnet 4.5 曾因接近上下文限制而提前结束任务（"上下文焦虑"），团队在调度器中添加了上下文重置逻辑。但当使用更强大的 Claude Opus 4.5 时，该行为已消失，之前的重置逻辑反而成了负担。

🏗️ 系统架构：三大核心抽象

受操作系统"虚拟化硬件"思想启发，Managed Agents 将 Agent 系统虚拟化为三个独立接口：

组件	职责	接口特点
Session（会话）	持久化存储所有事件的只追加日志（append-only log）	`getEvents()`, `emitEvent()`
Harness（调度器）	调用 Claude、路由工具调用、管理 Agent 循环逻辑	无状态，可热替换
Sandbox（沙箱）	Claude 执行代码、编辑文件的运行环境	`execute(name, input) → string`

复制代码

┌─────────────────┐
│   Claude (Brain)│
│   + Harness     │
└────────┬────────┘
         │  tool calls
         ▼
┌─────────────────┐
│   Sandbox/Tools │
│   (Hands)       │
└─────────────────┘
         │
         ▼
┌─────────────────┐
│    Session Log  │
│ (Durable State) │
└─────────────────┘

✅ 三大组件通过接口解耦，任一组件的实现可独立替换，不影响其他部分。

🔧 关键技术设计

1️⃣ 解耦"大脑"与"双手"

问题：早期将所有组件放在同一容器中，容器故障 = 会话丢失，且难以调试
方案：
- 调度器（Harness）移出容器，通过 execute() 调用沙箱
- 容器变为"牲口（cattle）"：失败后可自动重建，无需人工干预
- 调度器本身也无状态：崩溃后可通过 wake(sessionId) 从 Session 日志恢复

2️⃣ 安全边界设计

风险：若沙箱与凭证同容器，提示词注入可能窃取凭证
双重防护 ：
- 资源级认证：如 Git 仓库，克隆时注入 token，沙箱内操作无需接触凭证
- 凭证保险库：自定义工具通过 MCP 协议 + 代理调用，凭证存储在外部 Vault，调度器本身也看不到凭证

3️⃣ Session ≠ 上下文窗口

挑战：长任务超出 Claude 上下文限制，传统压缩/裁剪会丢失关键信息
方案：
- Session 作为外部持久化上下文对象，独立于模型上下文窗口
- 调度器通过 getEvents() 灵活查询：按位置切片、回溯、重读
- 上下文转换逻辑放在调度器层，便于适配未来模型的上下文工程需求

4️⃣ 性能优化：多大脑 + 多双手

优化点	效果
按需启动沙箱	无需等待容器预置，推理可立即开始
无状态调度器	可水平扩展，轻松支持多并发会话
结果	p50 TTFT（首 token 延迟）↓60%，p95 ↓90%+

🎯 适用场景

✅ 长周期复杂任务

代码库重构、多文件编辑
跨系统数据同步与迁移
自动化测试 + 修复循环

✅ 企业级集成

连接客户 VPC 内部资源（无需网络对等）
对接内部工具链、CI/CD 系统
合规审计：所有操作留痕于 Session 日志

✅ 高可靠性需求

会话状态持久化，支持断点续跑
组件故障自动恢复，无需人工介入

🚀 开始使用

访问 Claude Platform 文档
创建 Managed Agents 会话，配置所需工具/沙箱
通过 API 提交任务，系统自动调度执行
通过 Session 日志追踪执行过程与结果

💡 设计哲学总结

"How to design a system for programs as yet unthought of."

（如何为"尚未想到的程序"设计系统）

Managed Agents 的核心价值在于：

接口稳定：抽象出通用接口，适配未来模型与工具演进
实现灵活：调度策略、沙箱类型、存储后端均可替换
安全优先：凭证与执行环境物理隔离，最小权限原则
可观测性：所有事件持久化，支持审计与调试

这种"元调度器（meta-harness）"设计，使 Managed Agents 既能支持 Claude Code 等通用场景，也能适配垂直领域的定制化 Agent 流程，真正实现了面向未来的 Agent 基础设施。