

在亚马逊云科技re:Invent 2025大会上,亚马逊云科技首席执行官Matt Garman在十分钟内密集发布25项与基础设施相关的更新。从当初的一家云服务创业公司,到现在成为一家全球年收入超过1320亿美元的超级大公司,亚马逊云科技的成长史就是云的成长史。
如今,亚马逊云科技正迈上从云服务提供商向AI全栈技术供应商转型的新征程。Matt Garman在演讲中高频提及的"Why Not",无疑是创新的触发点,它不仅是解决当下问题的思路,更是面向未来的战略指引。
Why Not构建具有最广泛适应性的AI基础设施?
"说到AI基础设施,可能每个人想到的第一个就是GPU。没错!GPU是整个AI基础设施的核心部件."亚马逊云科技大中华区产品部总经理陈晓建表示,"亚马逊云科技是运行NVIDIA GPU的一个最佳硬件平台。"
构建AI基础设施,亚马逊云科技的核心策略可以概括为:实现全场景覆盖和先进AI能力的普惠,亚马逊云科技能够为各类不同的客户提供适配其不同应用场景的AI基础设施,让客户充分享受前沿技术带来的红利;实现性能、能效与成本的极致平衡,亚马逊云科技以"更快、更好、更具成本效应"为目标,通过全栈优化,在提升计算性能、内存带宽的同时,有效降低功耗与使用成本;实现持续迭代,长期引领技术发展,亚马逊云科技在坚持芯片、服务器等核心硬件代际升级的同时,同步整合上层AI平台服务,构建从底层硬件到上层应用的完整技术链条,以支撑更大规模、更复杂的AI模型训练与推理。
为实现上述目标,亚马逊云科技与NVIDIA等行业头部企业保持长期紧密的战略合作,其服务兼容主流高端GPU,同时结合自研芯片,为客户提供多元选择;确立合规与安全优先原则,充分保障客户数据主权与监管合规,并通过资源隔离、独立运营等设计,满足客户最严格的合规与安全要求;生态协同赋能,亚马逊云科技通过开放自研芯片与平台能力,支持Anthropic等生态伙伴的模型运行,协同推动AI技术规模化落地。
在产品和服务端,亚马逊云科技不断创新突破。Amazon EC2 P6E GB300实例是搭载NVIDIA最新GB300 NVL72系统的公有云实例,为最苛刻的AI工作负载提供一流计算能力,并依托亚马逊云科技全栈服务,具备顶尖性能与可靠性;Amazon AI Factories能够很好地适配客户自有数据中心与电力容量,并整合最新的NVIDIA GPU、Trainium自研芯片、SageMaker平台、Bedrock模型服务,在运行上满足合规、主权及监管要求;Amazon EC2 Trn3 UltraServers相比前一代性能有了大幅飞跃,计算能力提升4.4倍,内存带宽提升3.9倍,每兆瓦功耗可处理的tokens数量提升5倍,具有更高性价比;披露的下一代自研训练与推理芯片Amazon Trainium4,设计目标全面升级,能够支持更大的模型,适配更复杂的AI训练与推理需求。
据陈晓建介绍,亚马逊云科技拥有全球最大、部署最广泛的云基础设施和AI基础设施,覆盖全球38个区域、120个可用区,这一数字还在持续增长。亚马逊云科技致力于提供更高性价比的云服务,并且在基础设施领域持续创新。
Why Not借助亚马逊云科技在推理方面的更新,实现多场景适配?
在AI重塑各类应用的趋势下,推理已成为刚需。亚马逊云科技以Amazon Bedrock为载体,结合自研模型的迭代与生态扩展,实现了从原型到生产的全流程赋能。
作为全球领先的模型推理平台,Amazon Bedrock的优势进一步凸显。一方面,客户规模较一年前实现了翻倍,BMW、GoDaddy、Strava等全球各行各业的头部企业入驻,其中超50个客户在平台上处理的tokens数量突破了1万亿。另一方面,平台在安全性与实用性上不断优化,不仅内置安全护栏功能,最大程度地保障生成式AI应用的使用安全,而且支持灵活扩展,可满足从原型测试到大规模生产的多样化需求。
为解决单一模型难以适配所有场景的问题,Amazon Bedrock在本次re:Invent大会上宣布新增18个开放权重模型,构建了更丰富的模型生态。这些模型既包括Google Gemma、NVIDIA Nemotron等业界领先的国际模型,也将国内优秀的模型如MiniMax M2、Kimi K2 Thinking等纳入,再加上此前已上架的Qwen、DeepSeek等,实现了与中国千亿参数模型的深度合作,助力中国模型服务全球客户。
亚马逊云科技自研的Nova模型家族的迭代更是重要突破。新一代Nova 2家族针对不同场景打造细分模型,性价比与适配性大幅提升。Nova 2 Lite作为快速高效的轻量化模型,性价比突出,在指令追随、工具调用、代码生成等核心能力上表现优异,可与Claude Haiku4.5、GPT Mini等主流模型媲美,结合代码工具Kiro,能在几分钟内生成完整的应用网页,且无需过多人工介入。Nova 2 Pro是家族中最智能的型号,适配Agent支持、复杂工作流等高度复杂的工作场景,在关键基准测试中表现优异。Nova 2 Sonic聚焦语音交互,优化了延迟问题并扩展了语言支持范围,适用于实时AI通话等场景。Nova 2 Omni填补了跨模态推理的空白,是全球首个同时支持文本、图像、视频、音频四种输入模态的推理模型,无需多模型拼接即可完成复杂任务。
从整体上看,亚马逊云科技通过平台升级、模型迭代与生态扩展,构建了覆盖不同场景、兼具安全与高效的推理解决方案,为企业的AI应用落地提供了强有力的支撑。据陈晓建介绍,Amazon Bedrock在全球已为超过10万个客户提供了AI推理服务。Amazon Bedrock AgentCore面向Agentic AI持续快速更新,为企业级的Agent开发和部署提供了助力。而所有这些都建立在亚马逊云科技无与伦比的安全、可用、弹性的全球基础设施上。
Why Not构建兼具高效与低成本的数据基础设施?
数据是企业AI应用落地的核心竞争力。亚马逊云科技围绕数据存储、查询效率、场景适配等关键环节做文章,致力于为客户提供更高效、低成本且贴合业务实际需求的AI数据解决方案。
在向量存储方面,亚马逊云科技发布的Amazon S3 Vectors是业界首个支持向量存储与查询的对象存储服务。该服务允许用户在单个S3存储桶中存储多达数万亿个向量,同时将存储与查询成本降低90%。为满足向量查询的高性能需求,亚马逊云科技推出GPU加速向量索引技术,适配Amazon OpenSearch Service,并通过GPU对所有向量进行索引构建,相比以往,索引速度提升10倍,成本降低至原来的四分之一。
针对模型与业务场景的适配需求,亚马逊云科技发布了新的模型定制化能力,覆盖从简单到复杂的全流程模型定制需求。客户可通过这些能力让模型深度理解自身业务数据与场景,从而有效弥补了单纯依赖上下文提供或模型选择的局限性。
亚马逊云科技实现了"存储-查询-适配"的完整数据处理闭环,这既降低了企业向量数据管理的成本与复杂度,又通过高效协同与定制化能力提升了AI应用的实用性。
Why Not快速进入Agent的世界?
Agent带来的是范式的根本变化和新的价值创造方式。陈晓建认为,AI助手是辅助型、被动的工具,仅能响应预设的具体任务,如回答问题、执行明确指令等。而Agent则实现了交互形态的根本性转变,可承接开放性、模糊性任务,无需过多指引,便能自主拆解任务步骤、判断所需数据、协同外部系统完成端到端流程。一句话,Agent可以承担此前仅人类能完成的非简单信息检索类的复杂工作。
亚马逊云科技以"规模化落地、安全可控、低门槛赋能"为核心,构建了从底层开发平台到上层场景化应用的完整Agent生态。
作为Agent开发的核心底座,Amazon Bedrock AgentCore从初始的七大模块迭代为九大工具矩阵,覆盖"开发-部署-运维-治理"全生命周期。其基础核心能力包括Memory(管理长短期上下文,支撑个性化服务)、Identity(定义Agent角色与认证体系,适配企业权限)、Code Interpreter(安全执行代码,实现风险分析等自动化操作)、Runtime(隔离式运算环境,支持自动扩容与运维)、Observability(实时监控与智能运维)、Gateway(连接内外部系统)、Managed Browser(网页交互)等,有效解决了Agent开发的通用工程难题。另外,它还新增了Policy功能,并推出了Evaluations评估框架。
针对不同行业的业务痛点,亚马逊云科技推出了场景化的解决方案,应用了多款Agent产品。Amazon Quick整合多数据源,支持多Agent协作。亚马逊内部税务团队用其整合税务数据、跟踪政策变化,无需代码即可生成报告,从而提升了协同效率。Amazon Connect新增八种Agentic AI功能,进一步优化了客服体验。Amazon Transform支持老旧代码迁移,并新增了WebForm UI现代化与数据库自动化迁移功能。
为更好地迎接Agent时代的到来,亚马逊云科技基于"原子能力"设计,产品模块可按需组合,实现底层运维自动化,以降低Agent的开发与部署成本;通过隔离运行环境、动态策略监督、实时监控三重保障,确保Agent在企业规则框架内合规运行;从通用开发平台到垂直行业应用,兼顾企业级复杂需求与个人消费级便捷应用,实现应用场景的全覆盖,加速Agent在企业中的规模化落地。
"目前,已经有很多客户将构建Agent提上了日程。这也是为什么Amazon Bedrock AgentCore在不到半年的时间内进行了敏捷迭代的原因。亚马逊云科技投入了大量人力进行产品的推广。"陈晓建介绍说,"全球及大中华区都有大量客户在使用Amazon Bedrock AgentCore进行Agent开发。我相信,2026年会有更多客户在内部办公及对外业务中逐渐使用Agent。"
Why Not?触及灵魂的拷问
为了加快AI在企业中的落地,就需要从模型选择的灵活性、技术实现的简洁性、人才生态的可持续性、技术落地的普惠性四个维度发力,最终目标是"以 AI赋能场景、赋能人",从而有力地推动企业的数智化转型。
在re:Invent 2025大会上,Matt Garman之所以反复提及"Why Not",是希望通过亚马逊云科技的创新和以身作则,不断打破固有认知,推动AI合理落地,保障行业健康发展。
推荐阅读