Agent Native：重构 AI 云基础设施

本文整理自 2026 年 5 月 13 日 Create2026 百度 AI 开发者大会 - 技术与产品主论坛，百度集团副总裁侯震宇的主题演讲《Agent Native：重构 AI 云基础设施》。

5 月 13 日上午，在沈抖博士《万物一体、AI 云为基》的主题演讲中，分享了 Agent 在千行百业成功落地的真实案例，描绘出智能时代的宏伟蓝图，相信大家都迫不及待想奔赴产业智变的全新时代。

在本次的技术与产品主论坛，我们将进一步分享百度智能云如何帮助大家快速落地 Agent 方案，打造 AI 生产力，把握住智能时代的新机遇。

Agent 发展迭代离不开 AI 云基础设施的支撑，也对其提出了更高的要求，同时 AI 云也在持续进化。接下来我将分享 AI 云基础设施如何重构、如何释放 AI 生产力。

过去 2 年，Agent 完成了从概念验证、产品化探索，到成为大模型产业落地核心载体的跃迁式发展，而 Agent 的规模化落地，正是引爆万亿 Token 经济的核心引擎。

在过去 1 年中，全球周均 Token 调用量增长了 15 倍，而中国日均调用量的涨幅更是达到了 13 倍。

Token 需求的爆发，底层正是 Agent 生态的全面繁荣：

今年 1 月，OpenClaw 火爆全球，仅用 3 个月就超越 Linux 操作系统 15 年的累计星数，登顶开源社区榜首；
4 月，Hermes Agent 项目再掀全民「养马」热潮。

Agent 正在从企业与极客的小众圈层，完成面向大众市场的规模化出圈，这也为 Token 经济带来了新一轮的爆发式增长。

展望 2026 年，是 Agent 从单点落地走向全面规模化的关键一年。Token 需求将持续攀升，以 Token 为核心的全新经济体系正在重塑 AI 生产力的底层逻辑，也将成为智能时代产业竞争的核心。

今天，行业都在聊 Token 经济。

Token 经济的竞争本质从来不是单点技术的竞争，而是全栈基础设施的体系化竞争。围绕 Token 经济，AI 云基础设施正在发生一场全链路的重构，而这场重构核心就围绕「芯云模体」这四层展开：

第一层重构，发生在最底层的 AI 基建。它的核心逻辑，是从过去适配大模型训练，全面转向适配大规模推理场景。行业的技术焦点，也集中到了三个方向：提升电能转化效率、强化系统整体能力、实现供应自主可控。这一层决定了每一个 Token 的基础成本，是 Token 经济能不能规模化落地的根基。
第二层重构，是云平台的底层逻辑迭代。我们走过了云原生、AI 原生两个阶段，今天正式迈入了 Agent 原生的新阶段。行业的核心导向，也从训练优先彻底转向推理优先。整个云的技术栈、产品服务体系，都要为大规模智能体应用重做一遍。这一层决定了 Token 流转的整体效能，是承接万亿级 Token 调用的核心载体。
第三层重构，是模型层的价值回归。主流基础大模型已经从单一语言走向原生多模态，Physical AI 的发展也加速了 VLA、世界模型等多模态模型迭代。但更关键的行业共识是：单点模型的性能跑分，不再是关注焦点，大模型能不能嵌入真实业务场景、实现真正的可用价值，才是核心标尺。这一层决定了每一个 Token 的质量，是 Token 经济的价值内核。
第四层重构，是 Agent 层的研发范式变革。过去是「人写代码、人做验证、人用软件」，人的能力决定了研发和应用的上限；而未来将是「人定标准、Agent 自闭环交付、人和 Agent 用软件」，人将聚焦于产品构思等工作。这意味着研发流程与基础设施必须全面转向面向 Agent 友好以及 Agent 原生的方向。

这四层，分别对应 Token 经济的成本、效能、质量、生产力四大核心要素，只有全栈协同，才能最大化 Token 经济效益。

百度在「芯云模体」拥有全栈 AI 布局，不仅支撑着自有 Agent 的研发，更通过百度智能云，把这套体系化能力开放给全行业。

推理时代已全面到来，伴随 Token 规模的爆发式增长，推理集群由单一同构推理池向复杂异构推理系统演进：大模型推理实现了深度解耦，如 PD 分离、AFD 分离等，异构算力被极致精细化调度，这一切对底层 AI 基础设施提出了更高要求。

与此同时，2026 年行业算力供给紧张的态势愈发凸显，因此在有限的算力资源约束下，如何最大化单位 Token 的生产效率，已成为释放 AI 产业生产力的核心命题。

我们重点围绕构建大规模推理集群、提升 Token 生产效率做了系统性迭代升级：

首先，我们的新一代 AIDC3.0，可全预制化交付，实现超高密弹性供电和风液兼容，满足电能到 Token 的极致转化。
其次，我们升级了网络技术，依托全二层组网方案和多平面架构，让网络具备更强的故障容错能力，实现端到端时延优化 50%，支持按需搭建数十万、百万卡集群。
再次，我们推出天池超节点 2.0，相比上一代，吞吐性能提升 25%。同时，我们完成了文心、DeepSeek、GLM、Minimax 等主流系列模型的适配，将这些模型的推理效率提升 50%。
最后，我们研发了 KV Cache 分层存储池化、近访存加速等技术，为长上下文和长时间记忆提供了更优方案，极大提升长链路推理的性能。

当前 AI 算力的产业应用已呈现三大演进特征：全模态训练成为行业普遍趋势，Agentic AI 的场景重心向强化学习与推理深度迁移，Physical AI 聚焦端到端实验效率的规模化提升。

面对行业全新趋势，我们完成了全栈产品与技术的体系化升级，全方位助力客户在 AI 加速的新时代保持核心竞争力。

在核心技术与产品层面，我们实现了四大维度的重磅突破：

推出全模态训练框架 LoongForge，加速新一代的多模态大模型的迭代，一套框架覆盖 LLM、VLM、VLA、Diffusion 等不同场景，实现一套代码跑通GPU 与昆仑芯算力平台，训练效率领先行业 1 倍。
自研面向 Agentic 模型的强化学习框架，原生支持 Agentic RL、OPD 等主流场景，训练效率提升 1 倍，大幅加速大模型与智能体的能力进化迭代。
构建高效的推理系统。推出 vLLM-Kunlun，快速完成新模型在昆仑芯落地，Day0 支持了文心、GLM、MiMo 等模型。基于昆仑芯硬件特性开发专属算子，构建端到端量化体系，进一步提升模型推理性能。基于昆仑芯打造的 KV Cache 实现 90% 缓存命中率，实现大规模高效推理。
针对具身智能场景，我们打造并集成了完整的研发工具链，覆盖了数据、开发训练、强化学习、推理等全链路，对全模态模型训练过程实现了深度优化和高保真的仿真环境，帮助具身企业加速算法迭代过程，多模态训练吞吐提升 1 到 5 倍。

此外，我们始终坚信，AI 的蓬勃发展，离不开开源生态的繁荣与技术的普惠。为此，我们将全面开源自研训练引擎，以技术成果反哺开源社区，持续助力全行业释放 AI 生产力。

我们已经正式开源全模态训练框架 LoongForge，期待大家的积极试用与宝贵反馈，让我们共同推动 AI 生态的繁荣。

面对新时代、新形势、新需求，我们对 AI 计算基础设施做了全面升级，今天我们正式发布百度百舸 6.0。

百度百舸 6.0，从算力平台升级为智能工厂，为客户提供端到端优化的 AI Infra，最大化提升 Token 效能，释放 AI 生产力。百度百舸 6.0 主要包含四大重磅亮点：

第一，我们将于 6 月正式上线昆仑芯 256 超节点产品，为客户提供更强的国产算力；
第二，Agentic 模型训推系统全面升级，支持 Agent 规模化落地和进化迭代；
第三，具身智能研发全场景加速，加快具身实验效率和工程验证；
第四，百度百舸 AI Stack 轻量 GPU 云，支持百卡集群轻量部署，让企业也能快速使用百舸产品。

产业级 Agent 正在进入分水岭：Agent 不仅要真正具备可持续执行任务的能力，还要让企业敢用、会管、交付有保障。

我们先看执行能力。Agent 要完成一个任务，本质上要跑通 ReAct Loop：

第一步是思考，由模型能力进行支撑，完成意图理解、任务拆解和决策规划；
第二步是行动，依靠沙箱和 Skill 调用工具、连接系统，把规划转化为真实执行；
第三步是反馈，通过执行结果评估和会话记忆沉淀，不断修正路径、优化结果。

围绕这个闭环，我们构建了 Agent 原生的全栈基础设施：从模型、沙箱、网关，到安全、Skill、会话、可观测能力，形成了一套统一的 Agent 运行架构。这套架构既支撑了百度自身智能体的不断演进，也为客户快速构建专属智能体提供了统一的底座。

再看安全能力。Agent 时代，企业关注的重点是从「效率落地」走向「信任落地」。Agent 能否真正进入企业生产环境，不只取决于它能做多少事，更取决于企业是否看得清、管得住、敢放权。

围绕这一点，我们推出面向企业级 Agent 平台的 Agent 安全中心，以「看清楚、定边界」为核心，帮助企业构建起覆盖 Agent 运行时、Skill 生态和执行链路的安全可信体系。

我们核心解决的是企业最关心的两个问题：

第一，Agent 运行时，能不能守住环境、凭证和操作边界，让每一次执行都安全可控；
第二，Agent 调用 Skill、执行代码、处理内容时，能不能看清内容、代码和运行时的多维风险，并持续管控过程。只有把这两件事做好，企业才敢让 Agent 接入真实系统、承担真实任务。

百度智能云拥有从 Agent Infra、AI Infra，到多样化算力资源、海内外布局的全栈能力。我们支持 AI 进入真实业务、进入产业现场，也进入更广阔的物理世界：

一方面，我们帮助企业在电商运营、内容营销、客服售后等高频场景中，把 Agent 真正用起来、跑起来；另一方面，我们也在加速 Physical AI 的落地，支撑具身智能、汽车智驾这类前沿场景从技术验证走向产业应用。

具身智能是 AI 走向物理世界的关键场景，百度智能云已经走在这一领域的最前沿：我们在中国具身智能 AI 云市场排名第一，服务超过 30 家行业头部企业，加速具身智能产业发展。

每一次智能的跃迁，都在重新定义技术与产业的边界。

过去 3 年，我们共同见证了 AI 从识别、理解，到生成、创造。而今天，AI 正在跨越新的门槛------从生成内容，走向执行任务；从智能能力，走向智能生产力。智能时代，正在奔涌而来。

AI 云基础设施也不再只是算力与模型的承载平台，而是连接智能、产业与真实世界的关键底座。它将支撑 Agent 持续运行、可信交付，让智能生产力深入业务流程、产业现场和真实世界，成为推动千行百业跃迁的新力量。

新的生产力，呼唤新的时代底座。面向未来，百度智能云愿与所有客户和伙伴携手并肩，重构 AI 云基础设施，共赴更加辽阔的智能产业未来。谢谢大家！