2025年12月2日至4日,拉斯维加斯的 re:Invent 2025大会用三天高密度的技术发布与战略解读、现场体验,勾勒出AI从技术爆发迈向规模化应用的清晰路径。
在AWS re:Invent 2025大会第三天的Keynote中,亚马逊云科技公用计算高级副总裁Peter DeSantis明确对基础设施革新的技术拆解,安全性、可用性、弹性与成本优化是云服务的核心属性。

亚马逊云科技正通过大规模投资数据中心、电力与容量建设支撑全球AI转型,并聚焦芯片研发、网络升级与架构创新,以技术突破降低模型构建与工作负载运行成本,为客户打造全栈优化的基础设施解决方案。

亚马逊云科技公用计算高级副总裁Peter DeSantis
亚马逊全球副总裁、亚马逊云科技大中华区总裁储瑞松概括re:Invent 2025的关键词:Agent。以3nm芯片、低延迟网络保障Agent运行效率,通过Bedrock AgentCore等全栈能力构建Agent,让算力、平台、模型、数据管理、Agent开发工具形成的协同效应,最终形成对手难以复制的生态闭环。落地层面则以客户案例验证Agent在降本提效上的实际价值,推动Agent从概念走向规模化应用。

亚马逊全球副总裁、亚马逊云科技大中华区总裁储瑞松
自研芯片是亚马逊云科技基础设施竞争力的核心,此次发布的Graviton5服务器CPU与Trainium3 AI芯片,分别在通用计算与AI算力领域实现关键突破。以此为起点,亚马逊云科技在网络升级、生态协同等方面也展开了一系列动作,勾勒出了其基础设施革新的清晰逻辑。
作为亚马逊云科技最强大、最高效的自研服务器CPU,Graviton5采用3nm制程与Neoverse V3核心架构,单芯片集成192个核心,核心数较上一代翻倍。这种高密度设计缩短了核心间数据传输距离,通信延迟降低33%、带宽同步提升,能支撑实时游戏、EDA等高频交互场景,通过快速数据交换实现负载灵活扩展。

Graviton5核心性能较Graviton4提升25%,L3缓存容量达到192MB,是前代的5.3倍,每核心可访问的缓存量提升2.6倍,配合DDR5-8800高速内存与PCIe Gen 6接口,大幅降低数据访问延迟,显著提升内存密集型应用效率。
Graviton的诞生源于亚马逊云科技对云原生计算的深度思考。在Nitro系统成功验证定制芯片对网络和存储性能的提升价值后,团队提出疑问:"既然定制芯片能改善网络和存储性能,为什么不能应用于计算领域?"由此开启了专为云工作负载从零设计处理器的历程,核心目标是实现最优性价比。

Graviton5 基于 AWS Nitro 系统,利用第六代 Nitro 卡将虚拟化、存储和网络功能卸载到专用硬件。该架构几乎将服务器的所有计算和内存资源直接交付给用户的工作负载,同时实现了零操作员访问设计,从根本上防止任何其他系统或个人登录EC2服务器、读取实例内存或访问客户数据。
同时Graviton5引入了Nitro隔离引擎,作为Nitro系统的增强,利用形式验证提供数学确定性,确保工作负载彼此间及AWS操作员之间是隔离的。Nitro Isolation Engine的简约、经过正式验证的代码库采用数学证明,确保其行为完全符合定义,开创了数学验证云安全的新标准。
此外,全栈优化能力进一步放大了芯片优势。亚马逊云科技通过"直接贴合芯片"的裸片冷却技术,移除传统CPU的保护顶盖与对应热界面材料,减少热阻传导层级,使风扇功耗降低33%,在控制能耗的同时保障性能释放。实测数据显示,Graviton5在CPU密集型机器学习场景性能提升32%,数据库场景普遍提升约30%,苹果将核心服务迁移后实现40%性能提升与30%成本降低,SAP HANA分析查询性能更是提升60%。
同时基于Graviton5的M9g****实例(预览版)今日同步发布,相比M8g实例性能提升高达25%,是目前Amazon EC2中性价比最高的实例。
亚马逊云科技的芯片革新,体现在双产品线引领性能与成本革命,关于Trainium3 Ai芯片信息,我们下期继续解读。