最先进的 Agentic AI,现在是做什么工作的?
在搞太空探索。
上个月,蓝色起源「新格伦」重型运载火箭首次成功实现了一级回收,在与 SpaceX 的竞争中迈出了重要一步。Agent 在其中起到了举足轻重的作用。据说,蓝色起源全员都在用生成式 AI 工具提升效率,为此他们甚至构建了一个叫 BlueGPT 的内部平台。

BlueGPT 背靠亚马逊云科技的 AI 全家桶,有了它,蓝色起源的工程师在用 Agent 写代码,新格伦火箭在用 Agent 加速火箭发射的审批流程,供应链在用 Agent 沟通物料修改,航电部门在用 Agent 开发飞控软件......总体工程速度提升了 75%。原来贝索斯的新格伦追上马斯克的猎鹰,背后原因竟是这样。
这还只是新时代的冰山一角。今天凌晨,亚马逊云科技一年一度的 re:Invent 大会上,全世界都见证了「云计算一哥」一个又一个重量级新发布,大部分都是面向 Agentic AI 的。
在昨天、今天的 Keynote 中,亚马逊云科技向全球传递了一个明确信号:AI Agent(智能体)的时代已经全面开启。现在不跟上,可就要落后了。
全流程短板补齐后
Agent 能力实现爆发
亚马逊云科技认为,Agent 的出现正在让我们的轨迹发生变化,它对业务产生的影响或许就像当年互联网和云服务出现时一样大。
Agent 与传统大模型助手的根本区别在于其具有自主行动能力。它们不仅回答问题,还能主动帮用户执行任务,让工作流程自动化,并能在复杂环境中动态推理。如今在某些任务上,已有 AI Agent 将工作效率提高了 10 倍,这就让人们有了更多的时间可以专注于创造性的工作。那么问题来了 ------ 能让所有工作都获得这样的效率提升吗?Agent 又从何而来?
在当地时间周三 2025 re:Invent 的演讲中,亚马逊云科技 Agentic AI 高级副总裁 Swami Sivasubramanian 着重介绍了快速构建 Agent 的能力:

他先让我们回忆了一下:你当初写下第一行代码时是怎样的感觉?那时我们充满创作欲,仿佛能做到任何事。Agent 时代,我们正在找回这种创作的自由。
想让 Agent 真正落地到大规模生产阶段,是一件很有挑战的事。首先,如何快速、大规模地部署 Agent?
亚马逊云科技发布了开源、模型驱动的 AI Agent 框架 Strands Agents SDK 的更新。首先,Strands Agents SDK 被引入了 TypeScript 平台,让开发者能够使用 Amazon CDK 在 TypeScript 中构建完整的 Agent 堆栈。
Strands 同时新增了对边缘设备的支持,人们现在可以在小型设备上运行自主的 AI Agent,覆盖从汽车、游戏机到机器人等领域的大量应用场景。
全托管生成式 AI 服务 Amazon Bedrock 上,用于帮助开发者构建生产环境 Agent 的 AgentCore 新增了三大能力。
其中,Policy 让开发者可以使用自然语言为 Agent 操作设定清晰的边界。Evaluations 则提供 13 个预置评估器,可评估 Agent 行为的正确性和安全性等维度,并持续对实时交互进行采样,以便在性能下降时触发警报,从而简化日趋复杂的 Agent 行为监控。
如果想让 Agent 更加实用化,迈过能执行复杂工作的门槛,一个必须要解决的问题在于长期的记忆能力。如何让模型能够记住过去的交互、学到的知识?
AgentCore Memory 引入了全新的情景式功能,能够帮助 Agent 从过往经验中(上下文、推理、操作和结果)学习,让 AI 随着时间的推移逐步构建对用户的连贯理解,进而输出更加智能化的决策。

随着 Agent 构建变得越来越容易,下一个重要问题将随之而来:如何让它们更高效?
解决这个问题要从构建定制化的模型开始,Swami 表示,「如今的基础 AI 模型拥有足够高的智商,能够处理复杂易用、多步骤的推理以及突发情况,但它们并非总是最高效的。而 AI 的效率有关成本、规模、延迟与敏捷性。」
在他看来,能够高效执行特定任务的定制化高质量模型将成为主流。为此,亚马逊云科技推出了一系列旨在降低 AI 模型定制的复杂性和成本,同时「无需大量博士参与」的工具。
在 Amazon Bedrock 上,亚马逊云科技提出了全新的模型定制工具,其中强化学习微调(RFT)后的模型与基础模型相比准确率可提升 66%,大幅降低了模型定制化的门槛。针对特定任务的专业化训练 Model Distillation 旨在创建更小更快的模型,能够带来 10 倍的速度提升,同时保留 95-98% 的性能。

无服务器模型的定制功能是 AI Agent 引导的定制体验,只需自然语言交互即可定制模型。Amazon Nova Forge 开创了「开放式训练」的先河。它让企业能够在模型训练的每个阶段直接将专有数据与 Amazon Nova 基础模型原有的数据相融合。最终生成的定制模型不仅融合了 Amazon Nova 的全部知识和推理能力,还能深入理解了每个特定业务。

接下来还要支持的基础模型还包括 DeepSeek、GPT-OSS、Llama 和千问。现在,模型定制可在数天内完成,而不再需要数月。
而 Amazon SageMaker HyperPod 则缩短了重启周期,无需人工干预,几分钟内即可从模型训练故障中恢复,在拥有数千个 AI 加速器的集群上能实现 95% 的训练集群效率。Amazon SageMaker HyperPod 则简化了模型训练和部署的基础设施管理,最多可降低 40% 的成本。
最后,在生产环境中大量部署的 Agent,如何才能减少幻觉,值得我们信任?
在 AI IDE Kiro 上,工程师们结合大语言模型和自动推理(Automated Reasoning)数学逻辑验证的方法确保了 Agent 行为的正确性。
亚马逊云科技还提出了一套用于构建和管理可靠 UI 工作流程 AI Agent 的全新服务 ------Nova Act。它由定制版 Amazon Nova 2 Lite 模型驱动,为构建和管理自动化浏览器任务的代理集群提供了最快捷、最简便的途径。Nova Act 在早期客户工作流程中实现了高达 90% 的可靠性。
借助 Nova Act,开发者可以在几分钟内通过无代码的自然语言 Prompt 快速构建 Agent 原型,然后在熟悉的 IDE(例如 VS Code)中不断完善,最后部署到云环境上。
有多可靠呢?亚马逊云科技在现场展示了人机协作的反电诈,Agent 帮你识别信用卡盗刷:

在检查信用卡交易的过程中,Agent 可以合理提出怀疑,收集证据进行推理,还能直接帮你报警。现在,你可以更加自然地相信 Agent 为你办的事了。
从易用的 Agent 工具,高效率的模型定制化,到先进的可靠性技术,亚马逊云科技提出的一系列 AI 工具已经实现了从「如何构建」到「如何快速构建」的转变,让开发者们能够把宝贵的时间用在实践想法,创造新事物上。可谓是给未来的全新生产环境打好了基础。
这样的能力背后,是从最底层硬件算力开始,打造的一整套完善且独一无二的体系。
如何构建好 Agent?
分四步走
当地时间本周二,亚马逊云科技首席执行官 Matt Garman 在 2025re:Invent 大会第一天的 Keynote 上,深入介绍了自家最近各个维度的创新突破。

在长达两个小时十分钟的 Keynote 上,Matt Garman 花费了 50% 时间都在讲一件事:如何构建好 Agent。
在他看来,想要让 Agent 形成生产力,整条技术栈主要分成四大部分:算力基础设施、推理平台、数据以及构建 Agent 的工具链。

首先是算力基础设施。要构建最强大、最具扩展性的 AI 基础设施,必须拥有高度可扩展且安全的云平台。实现这一点并不容易,意味着需要在硬件和软件的每一层持续优化,而这正是亚马逊云科技的优势。
亚马逊云科技是目前运行 NVIDIA GPU 的最佳场所,在合作过程中,亚马逊云科技积累了丰富的大规模 GPU 运行经验。
在此基础上,亚马逊云科技进一步推出了 P6e 和 P6 两个实例,其中 P6e GB200 超级服务器相比上一代 P5e,计算性能提升超过 20 倍。亚马逊云科技还宣布推出全新的 P6e GB300,以满足最苛刻的 AI 工作负载。
在芯片方面,亚马逊云科技推出了最新的 Trainium 3 (首个云端 3nm 芯片)芯片实例,Trn3 UltraServers 正式全面可用。与上一代相比,新一代在关键性能上实现大幅跃升:计算能力提升 4.4 倍、内存带宽提高 3.9 倍、每瓦可处理的 Token 数量增加 5 倍,为大规模 AI 训练与推理带来显著的效率与能效优势。

除此之外,亚马逊云科技预告了全新的 Trainium4 芯片。作为最新一代 AI 加速芯片,它在关键性能指标上实现了大幅跃升:在 FP4 精度下提升 6 倍的算力,内存带宽提升 4 倍,内存容量翻倍,并通过 NVLink Fusion 与 UALink 支持更大规模的集群互联。
第二是推理平台。Amazon Bedrock 为用户提供了丰富而多元的模型选择,覆盖开源模型、通用模型以及专用模型等多种类型。此次,Amazon Bedrock 引入了多款最新开源模型,包括谷歌的 Gemma、NVIDIA 的 Nemotron,以及来自 KIMI 和 Minimax 厂商的最新模型。Mistral AI 的两款全新开源模型 Mistral Large 3 和 Ministral 3(3B、8B、14B)也已上线 Amazon Bedrock,从而为企业构建生成式 AI 应用带来更广泛、更灵活的选择空间。

除了引入大量第三方模型外,Amazon Bedrock 还集成了自研的基础模型系列 Amazon Nova。如今,Amazon Nova 家族全线迭代至 Amazon Nova 2,在延续强大智能能力的同时,将成本效率与低延迟表现大幅提升。当前,Amazon Nova 2 已推出四个版本:
-
Amazon Nova 2 Lite:快速、高效、经济的推理模型,适用于多种通用工作负载;
-
Amazon Nova 2 Pro:面向高度复杂任务,具备更强的推理能力,是迄今最智能的 Amazon Nova 推理模型,适用于高度复杂的工作负载;
-
Amazon Nova 2 Sonic:下一代语音到语音模型,提供行业领先对话质量,改进延迟,大幅扩展语言支持;
-
Amazon Nova 2 Omni:业界首个真正统一的多模态模型,支持文本、图像、视频、音频输入,并支持文本和图像输出。

在基准测试中,Amazon Nova 2 Lite 性能比肩 GPT-5 Mini、Claude Haiku 4.5 、Gemini Flash 2.5 等业界前沿模型。Amazon Nova 2 Pro 也表现亮眼,在指令遵循、Agentic 工具使用等基准上超越 GPT-5.1、Gemini 3 Pro Preview 以及 Claude Sonnet 4.5。
第三是数据。亚马逊云科技推出的全新服务 Amazon Nova Forge,提出了开放训练模型的概念。

第四部分是构建 Agent 的工具链。亚马逊云科技的先进 Agentic 平台 Amazon Bedrock AgentCore,可以大规模地安全构建、部署和运行高性能 Agent。为了确保 Agent 行为的安全性与合规性,亚马逊云科技开放了 Policy、Evaluations 功能,可以助力开发者构建可用于生产环境的 Agent。
基础搭好了,接下来是实践。
亚马逊云科技提出,要更快地把 Agent 加入到日常工作中来。Amazon Quick 作为一款面向企业的智能 Agent 应用,不仅能够帮助用户进行深度分析、数据可视化和工作流自动化,还通过企业级的安全与隐私标准确保信息的可靠性与合规性。

在人们关心的 AI 编程领域上,亚马逊云科技重点展示了构建、扩展、长期运行 Frontier Agent 能力。对此提出了三大 Agent:
-
Kiro Autonomous Agent:作为虚拟开发者,能够独立完成任务并在工作中持续学习;
-
Amazon Security Agent:承担虚拟安全工程师角色,在应用设计、代码审查与渗透测试等环节充当安全顾问;
-
Amazon DevOps Agent:帮助开发者,尤其是负责值班的工程师,主动发现系统故障或潜在缺陷。
从底层算力到推理平台,从数据到 Agent 工具链,再到面向企业实际落地的现代化与生产力产品,亚马逊云科技在今年 re:Invent 上勾勒出的,是一个面向 AI Agent 全面普及时代的完整蓝图。
数十亿 Agent 的未来
来得会比我们想象要快
作为技术全球化的推动者,亚马逊云科技每年的新发布都会受到开发者、企业的关注。在 AI 时代,其业务增长的速度也非常惊人。
2025 re:Invent 大会上,亚马逊云科技给出了一串数字:作为云基础设施的核心,Amazon S3 存储了超过 500 万亿个对象,每秒平均处理 2 亿次请求。而 AI 服务 Amazon Bedrock 目前为全球超过 10 万家企业提供 AI 推理支持。由此推动,亚马逊云科技的年收入已达 1320 亿美元,相比去年增长了 20%。
这不只是业绩展示,更是在指引 AI 时代的新方向 ------ 当全球企业加速拥抱生成式 AI 时,这家云巨头已经准备好了从芯片到应用的全套工具箱。在 Matt Garman 的想象中,未来每个公司、每个行业中都会活跃着数十亿个 Agent,每个组织、每个人都能从人工智能那里获得真实的价值。
新时代的大门已经打开,门后的世界,正在被重新定义。