谁在托举Agent?阿里云抢滩Agent Infra新赛道

黑马与巨头,角逐Agent Infra战场。

文|赵艳秋 周享玥

编|牛慧

今年Agent一波波热浪下,一家捷克创业公司------E2B,意外爆火。

成立两年,它的云端沙盒从默默无闻到月创建量突破1500万,一年暴涨375倍

这背后,是Agent正在掀起的新一轮云计算基础设施变革。

E2B起初只是一个让用户在云端安全隔离"沙盒"中运行AI代码生成的小项目,这些沙盒本质上是轻量级虚拟机。2024年10月,Anthropic推出Computer Use技术 ------让AI能像人类一样操作电脑。很快,E2B发现越来越多用户将其沙盒用于此类任务。随着Agent从实验室走向生产环境,E2B也顺势将定位升级为Agent运行环境

市场随即引爆------士气大增的E2B CEO也放话,要成为Agent时代的AWS,提供覆盖Agent从开发到部署全生命周期的自动化基础设施平台。

在云计算的发展史上,每一次应用形态的重大变化,都会催生新一代基础设施。十多年前,移动互联网兴起,推动云计算第一次大规模爆发------从社交到电商,从视频到打车,几乎所有应用后台都搬上了云。如今,这一幕正在Agent身上重演。

从去年下半年到现在,Agent正从技术探索快速走向生产环境。它们会写代码、做数据分析,还能自主浏览网页、跨软件执行任务,甚至开始完成复杂的跨平台业务操作。它们需要的,不是传统意义上的云主机,而是全新的运行环境------Agent Infra。有业内人士向数智前线"断言",未来3~5年,Agent Infra将是云计算竞争最激烈的焦点

大型云厂商岂能错失这样的机会?7月28日,在上海世界人工智能大会(WAIC)上,阿里云正式发布了专为Agent打造的无影AgentBay ,历时三个多月的内测和打磨,产品体验焕然一新。此前不久,AWS也推出AgentCore ,在部分区域试用。无论是E2B、AgentBay,还是AgentCore,它们本质都在做一件事------为Agent提供更好的基础设施,也就是Agent Infra

01

Agent上工,数字员工需要新一代"办公室"

短短一年时间,Agent已经从技术圈的"玩具",迅速进入企业生产一线。

在《财富》500强企业中,约79%已启动Agent项目 ,金融、电商、客服等行业已进入规模实践阶段。Gartner高级首席分析师费天褀告诉数智前线,中国企业Agent落地速度甚至快于全球:15%已实现生产落地,高于去年全球平均水平的10%。

这背后,不只是技术热度和噱头,更是企业的现实压力。对于中国企业,尤其是中小企业来说,引入Agent既是"生存创新",也是"普惠升级" 。他们倾向于先用小型、低成本Agent跑通业务,再逐步扩展。这种务实打法,让Agent在中国的商业化速度格外快

不过,从传统应用到Agent,有质的不同

如果说传统应用开发像"剧本杀",开发者提前写好剧情,系统只需按流程演一遍,Agent则更像"即兴演员",能自己判断场景、规划动作,还会在执行中随时调整。正如图灵奖得主Yann LeCun所说,Agent不应是"缸中之脑",而要能与环境交互、影响环境,并据此改变行为

与传统应用相比,Agent拥有更复杂的"工作能力和要求"

**•感知:**有"眼耳口鼻",能读屏、识图、听音、解析界面结构;

**•任务规划:**推理大模型将复杂目标拆成多步子任务,按反馈动态调整;

**•多工具协同:**调用多种工具和API,查数据、发邮件、翻译、编程......就像带着一把"瑞士军刀";

**•长期记忆:**跨会话保存状态,能记住历史信息持续优化决策;

**•自主交互环境:**像"数字员工"一样操作电脑、手机和网络,点击、输入、切换应用等。

阿里云无影事业部总裁张献涛直言,如果每家公司开发Agent,都要从零搭建这些能力,尤其是中小企业或个人开发者,几乎是不可能的。

跨境电商是Agent落地最快的行业之一。过去五年,中国跨境电商规模暴增10倍。整个跨境电商是一个复杂链路,从生产到在线交易再到物流、售后服务,Agent都在发挥作用。以运营小二为例,每天要花大约40%的时间联系商家确认是否参加大促活动,他们提取Excel 名单、打开钉钉找商家、发消息、等回复,回填表格......流程机械、耗时。

有了Agent,这件事可以全自动化,模型规划步骤、跨工具执行,一气呵成。不过,跨境电商参与者大都是中小企业,在国内超过70万家,多数缺乏技术能力。如何让他们能参与到Agent开发应用中,带来更加普惠和公平的交易秩序?

传统的本地化部署根本不能很好地支撑这样的需求,Agent上云迫在眉睫

本地算力,无法实现高并发。尤其是精准的Agent任务,会迅速耗尽算力资源。Manus年初demo期间的磕磕绊绊,问题也是出在了资源瓶颈上,AI推理的算力和执行任务的虚拟机都没有上云。

环境不匹配,传统云缺乏操作环境,难以让Agent像人一样操作电脑、手机和网络。

数据割裂,跨工具难以保证数据一致性。

还有安全隐患,要防止Agent误操作或泄密,需要额外隔离系统......

于是,Agent Infra诞生了 。它就像为**"数字员工"打造的云端办公室**------开箱即用,性能强劲,安全隔离到位,让企业尤其是中小商家,可以低门槛把Agent从试点推向生产落地。

在世界人工智能大会期间,张献涛进一步介绍,在阿里云看来,Agent开发需要构建一个类似"操作系统"的生态

就像传统操作系统产业链中,有人专注内核,有人打造中间件,有人开发应用层。张献涛介绍,在Agent开发生态中,这次商用的无影AgentBay类似"内核层",为Agent开发者提供从开发、测试到规模化运行的全生命周期服务。

它由阿里云无影事业部研发,该业务部在阿里云定位于云+端侧AI的重要承载者。无影AgentBay克服了Agent在高并发场景下的运行挑战。

同时,由于MCP协议只覆盖部分工具,且缺乏评价体系,市面上MCP工具质量参差不齐,导致Agent在任务执行中,一致性和精准度不足。为此,AgentBay将Browser Use、Computer Use、Mobile Use、Code Space四大沙箱环境打包成服务,覆盖了从Linux、Windows、Android主流环境,让Agent在跨环境、跨工具时保持稳定与准确执行。

如果AI大模型是大脑,AgentBay则帮助Agent装上"手和脚",让Agent不仅会思考,还能精准地动手做事。再加上跨环境持久化、智能感知与控制接口,以及秒级启动能力。就像为Agent准备了"专用电脑",但它不在你的桌子上,而是在云端。

数智前线获悉,从去年底,无影事业部就开始着手AgentBay的研发,来抢占Agent Infra先机。而这些能力的上线,也有赖于该平台"站在阿里云的肩膀上"来实现。

02

Agent Infra实战,数字员工这样干活

虽然Agent Infra建设时间不长,但市场已给出了积极反馈。

在海外,E2B沙盒月创建量一年暴涨375倍;国内,阿里无影AgentBay内测3个多月,就吸引了超过1000家客户申请使用,头部几家Agent公司都在用它做开发和运行。

有了Agent Infra的加持,Agent开发和使用,体感到底怎么样?在世界人工智能大会期间,我们看到了不少实操案例。

和去年相比,Agent的执行力已经完全不同------去年底,Agent像人一样操作电脑、手机,还是个新鲜事,而且要大量定制化开发,接口限制、界面识别都是难题;今年,Agent已经可以融入工作流,开始完成各种跨平台、多步骤任务。

场景一:跨平台自动化操作

在AgentBay的Computer Use环境中,开发者只需一句话: "安排2025年7月26日无影WAIC准备会议。"右侧沙箱显示,Agent就会自动打开钉钉,解析界面布局,找到日程功能区,填写会议信息并发送通知,整个过程仅十几秒,就完成了任务闭环。

这种能力突破了传统即时通讯软件因为非常多的接口受限,自动化难以落地的瓶颈。

另一个"Browser Use"案例,是让AI自动识别"2048"游戏并进行游玩。

这个操作看似简单,背后却有着复杂机制,AgentBay会解析游戏界面,识别数字区块和空白区域,推算下一步滑动方向,然后进行操作,之后还要观察下一个出现的数字,最后获得相应分数,这个分数已比大部分人玩的成绩要高很多。虽然只是个游戏场景,但技术核心和自动化业务流程相通------都要先看懂界面,再精准动手。

场景二:复杂任务拆解与执行

有位开发者在第三方编程工具 Cursor 中给了这样一个指令:"打开一个无影安卓环境,查找最近的加油站并推荐给我,给我一个访问链接,整个过程让我能看到。"

过去,这种任务需要自己开虚拟机,一步步来编程。

现在,AgentBay听懂后,会借助三方应用的能力把它自动拆成十几个小步骤:先生成访问链接,再打开高德地图,输入"加油站",读取结果并按距离排序,最后告诉你哪个最近。

更巧的是,如果执行中遇到UI元素识别失败或输入信息失败,它不会卡死,而是自动回到那一步重新执行,而不是等你手动救场。仅这一个产品上的设计,就解决了众多Agent开发者最头疼的问题------"到底卡在哪了呢?"

场景三:人机协作

跨平台操作中,还有一个老大难:账号登录与权限校验

很多时候,这类需要人工参与的环节会让自动化流程中断。那怎么既保证安全,又不让任务半路夭折呢?

现场演示中,在Cursor里输入:"搜索社交平台上关于某商品的使用心得,如果需要登录,就移交给我手动操作。"

Agent 执行到登录界面时,会自动切换到人机协作模式,把控制权交给人类。用户手动输入手机号和验证码,登录成功后,只需回复一句"我已登录",Agent就接过"接力棒",继续任务直到完成。

这种无缝切换得益于AgentBay自研的ASP协议,它能将云端环境完整、流畅地串流到本地,让人和Agent像同桌一样配合,任务不会半途而废。

03

Agent Infra的长跑才刚刚开始

根据大会期间,阿里云智能集团无影事业部资深产品总监李航介绍,支撑这些能力的,是AgentBay的5+3+N体系:

其中,"5"是Browser Use、Computer Use、Mobile Use、Code Space四大沙箱环境 以及统一持久化系统(构建一套跨平台数据漫游系统,确保任务切换时的连续性);

"3"是SDK、MCP、ASP三种交互方式,覆盖本地开发、跨平台工具、端云协作;

"N"是覆盖了云环境镜像、网络配置、MCP工具、实例生命周期管理等全流程自由定制工具链。

有了它,开发者不必再为底层环境和工具兼容操心,专注于业务逻辑和智能体设计即可,这让开发效率提升80% ,运维成本降低60% ,可靠性达99.99%。这将是新时代下,Agent应用开发的全新范式。

然而,这场关于Agent Infra的长跑才刚刚开始。

**如果未来Agent真要成为"数字分身",行业还需持续攻克优化一系列难题:**让它拥有真正的长期记忆、在多任务间高效协同、多工具间保持数据一致,并且在电脑、浏览器、手机等多终端中,都能用安全、易用、可扩展的沙箱来工作。

张献涛还透露,未来Agentbay还将向全能型Agent Infra演进,可以托管Agents应用,覆盖AI Agents从开发到部署的完整生命周期。

可以预见,Agent Infra不只是为Agent提供办公桌,它更像是为未来的"数字分身"打地基。这是一场刚刚开始的基础设施长跑,最终目标是------让每个行业都能用上属于自己的各种Agent。

相关推荐
XINVRY-FPGA18 小时前
EP4CE30F23I7N Altera Cyclone IV E SRAM FPGA
嵌入式硬件·fpga开发·云计算·硬件工程·信息与通信·信号处理·fpga
boonya1 天前
阿里云效一站式DevOps解决方案
阿里云·云计算·devops·阿里云效·一站式服务
方安乐1 天前
超简单腾讯云免费部署vue项目
云计算·腾讯云
Akamai中国1 天前
加速采用安全的企业级 Kubernetes 环境
人工智能·云计算·云服务·云存储
云计算小黄同学1 天前
CC攻击和DDOS的特征与防护(基于阿里云)
网络·安全·阿里云·ddos
wanhengidc1 天前
云手机如何进行数据备份
运维·服务器·科技·智能手机·云计算
云计算小黄同学1 天前
【基于阿里云ACK】详细介绍k8s日志系统的设计与部署
阿里云·kubernetes·云计算
阿里云通信1 天前
国内如何合规接入 WhatsApp Business API?阿里云作为 Meta Premier BSP 的完整技术指南
阿里云·云计算·whatsapp api·whatsapp bsp·whatsapp 服务商
翼龙云_cloud1 天前
阿里云渠道商:连接无影云电脑时最常见的问题有哪些?
服务器·阿里云·云计算·电脑·玩游戏