不久前,亚马逊云科技首席执行官Matt Garman在re:Invent大会上描绘了一个由"数十亿AI Agent"驱动的未来,他直言"Agent的出现使我们在AI轨迹上发生了变化------从一个技术奇迹的时代,转向真正获得价值的时代。"
纵观此次re:Invent大会上的密集发布,可以看出亚马逊云科技在Agentic AI时代的布局:通过贯穿从底层基础设施、推理平台、Agent构建平台到Agent应用的完整技术栈,系统性降低企业构建和部署生产级AI的门槛。

AI基础设施:自研芯片夯实算力基石
在Agentic时代,工作负载的复杂性要求,对底层算力提出了前所未有的挑战。亚马逊云科技的应对之策是"两条腿走路":在算力层面追求极致的性价比,在部署模式上提供前所未有的灵活性。
首先,是自研芯片的持续突破。
本次大会,亚马逊云科技推出最新一代自研训练芯片Amazon EC2 Trainium3 UltraServers,相比前代,其计算性能提升4.4倍,而更为关键的能效指标:每兆瓦功耗处理的AI Token数量提升了5倍。这直接回应了企业对于大模型训练成本的关切。
更引人注目的是对下一代Trainium4的预告,其承诺将在FP4计算性能上再提升6倍。这种快速的迭代节奏,彰显了亚马逊云科技通过自研芯片定义AI算力的决心。
同时,亚马逊云科技推出迄今性能最强、能效最高的自研处理器Amazon Graviton5。目前,亚马逊云科技新增CPU容量中连续第三年有超半数由Graviton驱动,EC2头部1000家客户中已有98%受益于其显著的性价比优势,包括Adobe、Airbnb、Atlassian、Epic Games、Formula 1、Pinterest、SAP、Siemens、Snowflake与Synopsys等。

其次,是开创性的混合部署模式。
新推出的 Amazon AI Factory 服务允许企业在自己的数据中心内部署由亚马逊云科技提供的专用AI基础设施,最新的NVIDIA加速计算平台、Trainium芯片、AI服务以及亚马逊云科技高速低延迟的网络。
Amazon AI Factory由亚马逊云科技负责集成基础设施的部署与管理,避免自建过程中的复杂性。本质上是亚马逊云科技将其"AI基础设施能力栈"进行了空间解耦,让算力去适应客户数据的位置,而非相反。
推理平台:多元模型与自研模型迭代
企业业务场景的多样性,决定了没有万能的AI大模型。亚马逊云科技在推理平台层面推行"多元主义"生态战略,同时以自研Nova系列模型不断提升性价比。
其全托管服务 Amazon Bedrock 是这一战略的承载核心。本次大会Amazon Bedrock一次性新增了18个开放权重模型。包含来自Google的Gemma 3、来自Moonshot AI的Kimi K2 Thinking、来自MiniMax的MiniMax M2,以及NVIDIA的Nemotron和OpenAI的GPT OSS Safeguard等多款热门模型。这种"模型开放市场"的策略赋予了企业根据需求选择最佳工具的灵活性。

同时,亚马逊云科技推出了自研的 Amazon Nova 2 模型家族,旨在定义AI推理的"性价比"新标准。
其中,Nova 2 Lite是面向日常工作负载的快速、经济型推理模型;
Nova 2 Pro是亚马逊最智能的推理模型,能够处理文本、图像、视频和语音输入,并生成文本输出,也被称作"教师模型";
Nova 2 Omni是亚马逊的端到端语音模型,该模型支持更多语言和富有表现力的音色,并提供高达100万 tokens的上下文窗口,能够在语音与文本之间无缝切换。
数据底座:海量存储与向量搜索结合
"让模型去了解您的数据是至关重要的,因为数据是您区别于竞争对手的关键。"亚马逊云科技大中华区产品部总经理陈晓建表示。
此次大会,云存储服务Amazon S3发布一系列重磅更新,包括Amazon S3 Vectors正式可用并实现每索引20亿向量的规模突破、Amazon S3对象最大容量从5TB扩展至50TB、Amazon S3 Batch Operations处理速度提升10倍等。
通过将Amazon S3 Vectors的海量存储能力与向量搜索Amazon OpenSearch Service的实时查询能力结合使用,足以满足丰富场景下的数据存储和检索需求。例如Adobe或国内的一些智能摄像头客户,原本就在使用Amazon S3存储海量视频,现在还可以通过Amazon OpenSearch Service对视频和音频数据进行自然语言搜索。
Agent构建工具:跨越从"试点"到"生产"的鸿沟
今年亚马逊云科技推出了AgentCore,贯穿从构建、部署到运营Agent的完整开发生命周期,旨在帮助企业快速将Agent从试点阶段推进到生产环境。
AgentCore不是单一工具,而是一个模块化的"生产就绪"组件库,提供构建企业级Agent所需的一切后台能力:安全的运行时环境、记忆管理、身份集成、可观测性等。本次大会为其新增的三项新功能,直指生产部署的核心痛点:
Policy in Amazon Bedrock AgentCore,用于帮助企业为Agent的操作设定清晰的边界。团队可以使用自然语言,通过定义Agent可访问的工具和数据、可执行的操作以及适用条件,为其划定具体范围。
AgentCore Evaluations旨在评估AI Agent的质量,它会持续采样Agent的实时交互数据,并根据正确性、实用性、安全性等预置标准分析Agent行为。
AgentCore Memory强化了AI Agent的记忆能力。能够从过往经验中学习,并在后续交互中优化决策。
这些新功能共同将Agent开发从"手工作坊"模式,推进到了标准化、可管控、可评估的"工业化"平台阶段。
除了提供工具,亚马逊云科技更通过发布Kiro、Amazon Security Agent、Amazon DevOps Agent三款"前沿Agent",为业界展示了AI Agent的能力范式和颠覆性潜力。其中,Kiro是一个高度智能化的编程助手。它采用Spec-Driven Programming(规格驱动编程),通过人的指令逐步分解并自动化完成任务,同时能与人交互并接受建议,最终达成目标。
结语
Agentic时代的竞争,本质上是全栈技术能力与平台化生态的竞争。
透视re:Invent 2025,亚马逊云科技正通过其全栈AI能力,加速"数十亿AI Agent"时代的到来,帮全球企业跨越从AI演示到商业价值的鸿沟。
END
本文为「智能进化论」原创作品。