Anthropic Managed Agents 详细介绍

Anthropic Managed Agents 详细介绍

原文:Scaling Managed Agents: Decoupling the brain from the hands


🔍 核心概念

Managed Agents 是 Anthropic 在 Claude 平台上推出的托管服务,专门用于运行长周期(long-horizon)的 Agent 任务 。其核心设计理念是:将"大脑"(Claude 模型 + 调度逻辑)与"双手"(执行环境/工具)解耦,通过稳定的接口抽象,使系统能够适应未来模型能力的演进。

关键洞察

"Harnesses encode assumptions that go stale as models improve."

(调度器编码了关于"模型不能做什么"的假设,但这些假设会随着模型进步而过时)

例如:Claude Sonnet 4.5 曾因接近上下文限制而提前结束任务("上下文焦虑"),团队在调度器中添加了上下文重置逻辑。但当使用更强大的 Claude Opus 4.5 时,该行为已消失,之前的重置逻辑反而成了负担。


🏗️ 系统架构:三大核心抽象

受操作系统"虚拟化硬件"思想启发,Managed Agents 将 Agent 系统虚拟化为三个独立接口:

组件 职责 接口特点
Session(会话) 持久化存储所有事件的只追加日志(append-only log) getEvents(), emitEvent()
Harness(调度器) 调用 Claude、路由工具调用、管理 Agent 循环逻辑 无状态,可热替换
Sandbox(沙箱) Claude 执行代码、编辑文件的运行环境 execute(name, input) → string
复制代码
┌─────────────────┐
│   Claude (Brain)│
│   + Harness     │
└────────┬────────┘
         │  tool calls
         ▼
┌─────────────────┐
│   Sandbox/Tools │
│   (Hands)       │
└─────────────────┘
         │
         ▼
┌─────────────────┐
│    Session Log  │
│ (Durable State) │
└─────────────────┘

✅ 三大组件通过接口解耦,任一组件的实现可独立替换,不影响其他部分。


🔧 关键技术设计

1️⃣ 解耦"大脑"与"双手"

  • 问题:早期将所有组件放在同一容器中,容器故障 = 会话丢失,且难以调试
  • 方案
    • 调度器(Harness)移出容器,通过 execute() 调用沙箱
    • 容器变为"牲口(cattle)":失败后可自动重建,无需人工干预
    • 调度器本身也无状态:崩溃后可通过 wake(sessionId) 从 Session 日志恢复

2️⃣ 安全边界设计

  • 风险:若沙箱与凭证同容器,提示词注入可能窃取凭证
  • 双重防护
    • 资源级认证:如 Git 仓库,克隆时注入 token,沙箱内操作无需接触凭证
    • 凭证保险库:自定义工具通过 MCP 协议 + 代理调用,凭证存储在外部 Vault,调度器本身也看不到凭证

3️⃣ Session ≠ 上下文窗口

  • 挑战:长任务超出 Claude 上下文限制,传统压缩/裁剪会丢失关键信息
  • 方案
    • Session 作为外部持久化上下文对象,独立于模型上下文窗口
    • 调度器通过 getEvents() 灵活查询:按位置切片、回溯、重读
    • 上下文转换逻辑放在调度器层,便于适配未来模型的上下文工程需求

4️⃣ 性能优化:多大脑 + 多双手

优化点 效果
按需启动沙箱 无需等待容器预置,推理可立即开始
无状态调度器 可水平扩展,轻松支持多并发会话
结果 p50 TTFT(首 token 延迟)↓60%,p95 ↓90%+

🎯 适用场景

长周期复杂任务

  • 代码库重构、多文件编辑
  • 跨系统数据同步与迁移
  • 自动化测试 + 修复循环

企业级集成

  • 连接客户 VPC 内部资源(无需网络对等)
  • 对接内部工具链、CI/CD 系统
  • 合规审计:所有操作留痕于 Session 日志

高可靠性需求

  • 会话状态持久化,支持断点续跑
  • 组件故障自动恢复,无需人工介入

🚀 开始使用

  1. 访问 Claude Platform 文档
  2. 创建 Managed Agents 会话,配置所需工具/沙箱
  3. 通过 API 提交任务,系统自动调度执行
  4. 通过 Session 日志追踪执行过程与结果

💡 设计哲学总结

"How to design a system for programs as yet unthought of."

(如何为"尚未想到的程序"设计系统)

Managed Agents 的核心价值在于:

  • 接口稳定:抽象出通用接口,适配未来模型与工具演进
  • 实现灵活:调度策略、沙箱类型、存储后端均可替换
  • 安全优先:凭证与执行环境物理隔离,最小权限原则
  • 可观测性:所有事件持久化,支持审计与调试

这种"元调度器(meta-harness)"设计,使 Managed Agents 既能支持 Claude Code 等通用场景,也能适配垂直领域的定制化 Agent 流程,真正实现了面向未来的 Agent 基础设施


相关推荐
跨境卫士—小依2 小时前
平台流量分发机制变化跨境卖家如何重新获取曝光
大数据·人工智能·跨境电商·亚马逊·营销策略
阿杰学AI2 小时前
AI核心知识120—大语言模型之 基于人类反馈的强化学习 (简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·rlhf·基于人类反馈的强化学习
羽师2 小时前
MoE是什么?
人工智能
亚马逊云开发者2 小时前
OpenClaw 部署安全第一步:用 VPC Endpoint 让 AI Agent 调用 Bedrock 全走内网
人工智能·安全
优家数科2 小时前
2026 中国净水出海白皮书:欧洲准入的技术红线与智能化破局
人工智能·mysql瓶颈
ZPC82102 小时前
MoveIt Servo 与自己编写的 Action Server 通信
人工智能·算法·机器人
AIminminHu2 小时前
OpenGL渲染与几何内核那点事-项目实践理论补充(一-3-(1):你的 CAD 终于能联网协作了,但渲染的“内功心法”到底是什么?)
人工智能·opengl
AI自动化工坊2 小时前
Caveman技能实战:优化AI对话风格实现65%的token成本节省
人工智能·深度学习·机器学习·ai·token·caveman
有个人神神叨叨2 小时前
Claude Managed Agents 快速入门笔记
人工智能·笔记