随着 AI Agent 大规模爆发式增长,云上算力的形态正在被重新定义。AI Agent 负载呈现出与传统业务截然不同的特征------生命周期短、按需即时拉起、突发负载难以预期等特点,需要在秒级完成 Agent Sandbox 大规模并发启动。这种"瞬时爆发、即用即走"的运行模式,对底层基础设施尤其是块存储提出了前所未有的挑战。
近日,在 2026 阿里云峰会上,阿里云正式宣布块存储 EBS "云盘克隆"功能公测上线 ,构建**"克隆+预热"双引擎**,提供从模型、镜像分发到计算端预热的一体化加速方案,实现镜像百毫秒级加载就绪,支撑 Agent Sandbox 大规模并发弹性启动。

云盘克隆 支持在同一可用区内,基于一块使用中的云盘,快速复制出包含相同数据的新云盘,无需经过快照中转,实现数据的高效分发。新云盘可自定义容量(支持扩容)、规格类型及加密属性等,适用于强化学习分支探索、开发环境的快速复制以及业务变更前的数据隔离验证等场景。
快照预热 则从根本上解决了快照创建云盘后的"冷启动"问题。通过提前加载快照数据,确保新创建的云盘快速完成初始化,具备完整的 I/O 性能,从而消除首次数据访问时的延迟。该能力支持设定预热时长与并发创盘规模,最大支持 1 万块 云盘并发创建且性能无损,适合大规模实例启动、模型分发与集群快速扩容等场景。
两大能力协同工作,灵活适配不同的数据存放形态:当数据存储在云盘时,可通过克隆实现数据的高效复制和就近分发;当数据存储在快照(如镜像)时,可通过快照预热提前将数据预热到计算实例所在的同一可用区,支撑 Agent 的大规模并发启动。
目前,EBS 云盘克隆已全面接入 ACS Sandbox 业务:通过云盘克隆实现 Sandbox 快速迁移,支撑 Sandbox 高可用;ACS Sandbox 依赖的镜像通过快照预热消除启动长尾问题,稳定支撑最大每分钟 15,000 次的并发扩容规模,为上层 AI Agent 应用提供超大规模、即创即用的 Sandbox 算力底座。
在互联网领域,某短视频直播行业头部客户,为内部员工打造企业级 Agent 个人助理,呈现典型的"潮汐式"负载。下班时段批量休眠 Agent 并将云盘数据转为快照,实现存储降本;上班前通过快照预热将镜像数据提前预加载,轻松应对万级 Sandbox 同时唤醒的"启动风暴",存储成本最高可降低 80%。
除 Agent Sandbox 场景外,云盘克隆在 AI 推理与游戏发版等场景中同样适用:面向推理服务,可加速模型文件在多张 GPU 卡之间的快速分发与加载,大幅缩短推理服务冷启动耗时,降低算力空闲成本;面向游戏业务场景,可加速游戏版本的批量分发,满足开服、扩容、弹性调度等业务诉求。
目前,EBS 云盘克隆已在中国站及国际站开放公测,欢迎点击试用。阿里云将持续深耕 Agent Native 基础设施,助力企业以更低成本、更高效率推进 AI 应用的规模化落地。