Anthropic Managed Agents 详细介绍

Anthropic Managed Agents 详细介绍

原文:Scaling Managed Agents: Decoupling the brain from the hands


🔍 核心概念

Managed Agents 是 Anthropic 在 Claude 平台上推出的托管服务,专门用于运行长周期(long-horizon)的 Agent 任务 。其核心设计理念是:将"大脑"(Claude 模型 + 调度逻辑)与"双手"(执行环境/工具)解耦,通过稳定的接口抽象,使系统能够适应未来模型能力的演进。

关键洞察

"Harnesses encode assumptions that go stale as models improve."

(调度器编码了关于"模型不能做什么"的假设,但这些假设会随着模型进步而过时)

例如:Claude Sonnet 4.5 曾因接近上下文限制而提前结束任务("上下文焦虑"),团队在调度器中添加了上下文重置逻辑。但当使用更强大的 Claude Opus 4.5 时,该行为已消失,之前的重置逻辑反而成了负担。


🏗️ 系统架构:三大核心抽象

受操作系统"虚拟化硬件"思想启发,Managed Agents 将 Agent 系统虚拟化为三个独立接口:

组件 职责 接口特点
Session(会话) 持久化存储所有事件的只追加日志(append-only log) getEvents(), emitEvent()
Harness(调度器) 调用 Claude、路由工具调用、管理 Agent 循环逻辑 无状态,可热替换
Sandbox(沙箱) Claude 执行代码、编辑文件的运行环境 execute(name, input) → string
复制代码
┌─────────────────┐
│   Claude (Brain)│
│   + Harness     │
└────────┬────────┘
         │  tool calls
         ▼
┌─────────────────┐
│   Sandbox/Tools │
│   (Hands)       │
└─────────────────┘
         │
         ▼
┌─────────────────┐
│    Session Log  │
│ (Durable State) │
└─────────────────┘

✅ 三大组件通过接口解耦,任一组件的实现可独立替换,不影响其他部分。


🔧 关键技术设计

1️⃣ 解耦"大脑"与"双手"

  • 问题:早期将所有组件放在同一容器中,容器故障 = 会话丢失,且难以调试
  • 方案
    • 调度器(Harness)移出容器,通过 execute() 调用沙箱
    • 容器变为"牲口(cattle)":失败后可自动重建,无需人工干预
    • 调度器本身也无状态:崩溃后可通过 wake(sessionId) 从 Session 日志恢复

2️⃣ 安全边界设计

  • 风险:若沙箱与凭证同容器,提示词注入可能窃取凭证
  • 双重防护
    • 资源级认证:如 Git 仓库,克隆时注入 token,沙箱内操作无需接触凭证
    • 凭证保险库:自定义工具通过 MCP 协议 + 代理调用,凭证存储在外部 Vault,调度器本身也看不到凭证

3️⃣ Session ≠ 上下文窗口

  • 挑战:长任务超出 Claude 上下文限制,传统压缩/裁剪会丢失关键信息
  • 方案
    • Session 作为外部持久化上下文对象,独立于模型上下文窗口
    • 调度器通过 getEvents() 灵活查询:按位置切片、回溯、重读
    • 上下文转换逻辑放在调度器层,便于适配未来模型的上下文工程需求

4️⃣ 性能优化:多大脑 + 多双手

优化点 效果
按需启动沙箱 无需等待容器预置,推理可立即开始
无状态调度器 可水平扩展,轻松支持多并发会话
结果 p50 TTFT(首 token 延迟)↓60%,p95 ↓90%+

🎯 适用场景

长周期复杂任务

  • 代码库重构、多文件编辑
  • 跨系统数据同步与迁移
  • 自动化测试 + 修复循环

企业级集成

  • 连接客户 VPC 内部资源(无需网络对等)
  • 对接内部工具链、CI/CD 系统
  • 合规审计:所有操作留痕于 Session 日志

高可靠性需求

  • 会话状态持久化,支持断点续跑
  • 组件故障自动恢复,无需人工介入

🚀 开始使用

  1. 访问 Claude Platform 文档
  2. 创建 Managed Agents 会话,配置所需工具/沙箱
  3. 通过 API 提交任务,系统自动调度执行
  4. 通过 Session 日志追踪执行过程与结果

💡 设计哲学总结

"How to design a system for programs as yet unthought of."

(如何为"尚未想到的程序"设计系统)

Managed Agents 的核心价值在于:

  • 接口稳定:抽象出通用接口,适配未来模型与工具演进
  • 实现灵活:调度策略、沙箱类型、存储后端均可替换
  • 安全优先:凭证与执行环境物理隔离,最小权限原则
  • 可观测性:所有事件持久化,支持审计与调试

这种"元调度器(meta-harness)"设计,使 Managed Agents 既能支持 Claude Code 等通用场景,也能适配垂直领域的定制化 Agent 流程,真正实现了面向未来的 Agent 基础设施


相关推荐
冬奇Lab11 小时前
RAG 系列(十一):Rerank——让检索结果按重要性排队
人工智能·llm·源码
冬奇Lab11 小时前
一天一个开源项目(第96篇):OpenHarness - 轻量级 AI 代理基础设施框架
人工智能·开源·资讯
lulu121654407811 小时前
JetBrains IDE 终极AI编程方案:CC GUI插件让Claude Code和Codex丝滑运行
java·ide·人工智能·python·ai编程
TENSORTEC腾视科技12 小时前
腾视科技重磅推出AI NAS,重塑数据管理方式,开启智能高效新时代
人工智能·ai·七牛云存储·nas·企业存储·ainas·家庭存储
tanis_207712 小时前
MinerU2.5-Pro 中文 PDF 识别准确率全解:OmniDocBench v1.6 权威基准数据
人工智能·python·pdf
我是发哥哈12 小时前
跨AI模型生成视频的五大维度对比:选型避坑指南
大数据·人工智能·学习·机器学习·chatgpt·音视频
如去12 小时前
第四篇《AI+教育:个性化学习的实现路径与教育公平的再平衡》
人工智能
Elastic 中国社区官方博客12 小时前
Elastic 9.4:Workflows 正式发布、Agent Builder 更新,以及 Prometheus / PromQL 支持
运维·数据库·人工智能·elasticsearch·搜索引擎·信息可视化·prometheus
机器视觉_Explorer13 小时前
【halcon】编程技巧:鼠标擦除
图像处理·人工智能·深度学习·算法·视觉检测
杨航 AI13 小时前
XGBoost · 登录防欺诈示例
人工智能