Agent Native:重构 AI 云基础设施

本文整理自 2026 年 5 月 13 日 Create2026 百度 AI 开发者大会 - 技术与产品主论坛,百度集团副总裁侯震宇的主题演讲《Agent Native:重构 AI 云基础设施》。


5 月 13 日上午,在沈抖博士《万物一体、AI 云为基》的主题演讲中,分享了 Agent 在千行百业成功落地的真实案例,描绘出智能时代的宏伟蓝图,相信大家都迫不及待想奔赴产业智变的全新时代。

在本次的技术与产品主论坛,我们将进一步分享百度智能云如何帮助大家快速落地 Agent 方案,打造 AI 生产力,把握住智能时代的新机遇。

Agent 发展迭代离不开 AI 云基础设施的支撑,也对其提出了更高的要求,同时 AI 云也在持续进化。接下来我将分享 AI 云基础设施如何重构、如何释放 AI 生产力。

过去 2 年,Agent 完成了从概念验证、产品化探索,到成为大模型产业落地核心载体的跃迁式发展,而 Agent 的规模化落地,正是引爆万亿 Token 经济的核心引擎。

在过去 1 年中,全球周均 Token 调用量增长了 15 倍,而中国日均调用量的涨幅更是达到了 13 倍。

Token 需求的爆发,底层正是 Agent 生态的全面繁荣:

  • 今年 1 月,OpenClaw 火爆全球,仅用 3 个月就超越 Linux 操作系统 15 年的累计星数,登顶开源社区榜首;
  • 4 月,Hermes Agent 项目再掀全民「养马」热潮。

Agent 正在从企业与极客的小众圈层,完成面向大众市场的规模化出圈,这也为 Token 经济带来了新一轮的爆发式增长。

展望 2026 年,是 Agent 从单点落地走向全面规模化的关键一年。Token 需求将持续攀升,以 Token 为核心的全新经济体系正在重塑 AI 生产力的底层逻辑,也将成为智能时代产业竞争的核心。

今天,行业都在聊 Token 经济。

Token 经济的竞争本质从来不是单点技术的竞争,而是全栈基础设施的体系化竞争。围绕 Token 经济,AI 云基础设施正在发生一场全链路的重构,而这场重构核心就围绕「芯云模体」这四层展开:

  • 第一层重构,发生在最底层的 AI 基建。它的核心逻辑,是从过去适配大模型训练,全面转向适配大规模推理场景。行业的技术焦点,也集中到了三个方向:提升电能转化效率、强化系统整体能力、实现供应自主可控。这一层决定了每一个 Token 的基础成本,是 Token 经济能不能规模化落地的根基。
  • 第二层重构,是云平台的底层逻辑迭代。我们走过了云原生、AI 原生两个阶段,今天正式迈入了 Agent 原生的新阶段。行业的核心导向,也从训练优先彻底转向推理优先。整个云的技术栈、产品服务体系,都要为大规模智能体应用重做一遍。这一层决定了 Token 流转的整体效能,是承接万亿级 Token 调用的核心载体。
  • 第三层重构,是模型层的价值回归。主流基础大模型已经从单一语言走向原生多模态,Physical AI 的发展也加速了 VLA、世界模型等多模态模型迭代。但更关键的行业共识是:单点模型的性能跑分,不再是关注焦点,大模型能不能嵌入真实业务场景、实现真正的可用价值,才是核心标尺。这一层决定了每一个 Token 的质量,是 Token 经济的价值内核。
  • 第四层重构,是 Agent 层的研发范式变革。过去是「人写代码、人做验证、人用软件」,人的能力决定了研发和应用的上限;而未来将是「人定标准、Agent 自闭环交付、人和 Agent 用软件」,人将聚焦于产品构思等工作。这意味着研发流程与基础设施必须全面转向面向 Agent 友好以及 Agent 原生的方向。

这四层,分别对应 Token 经济的成本、效能、质量、生产力四大核心要素,只有全栈协同,才能最大化 Token 经济效益。

百度在「芯云模体」拥有全栈 AI 布局,不仅支撑着自有 Agent 的研发,更通过百度智能云,把这套体系化能力开放给全行业。

推理时代已全面到来,伴随 Token 规模的爆发式增长,推理集群由单一同构推理池向复杂异构推理系统演进:大模型推理实现了深度解耦,如 PD 分离、AFD 分离等,异构算力被极致精细化调度,这一切对底层 AI 基础设施提出了更高要求。

与此同时,2026 年行业算力供给紧张的态势愈发凸显,因此在有限的算力资源约束下,如何最大化单位 Token 的生产效率,已成为释放 AI 产业生产力的核心命题。

我们重点围绕构建大规模推理集群、提升 Token 生产效率做了系统性迭代升级:

  • 首先,我们的新一代 AIDC3.0,可全预制化交付,实现超高密弹性供电和风液兼容,满足电能到 Token 的极致转化。
  • 其次,我们升级了网络技术,依托全二层组网方案和多平面架构,让网络具备更强的故障容错能力,实现端到端时延优化 50%,支持按需搭建数十万、百万卡集群。
  • 再次,我们推出天池超节点 2.0,相比上一代,吞吐性能提升 25%。同时,我们完成了文心、DeepSeek、GLM、Minimax 等主流系列模型的适配,将这些模型的推理效率提升 50%。
  • 最后,我们研发了 KV Cache 分层存储池化、近访存加速等技术,为长上下文和长时间记忆提供了更优方案,极大提升长链路推理的性能。

当前 AI 算力的产业应用已呈现三大演进特征:全模态训练成为行业普遍趋势,Agentic AI 的场景重心向强化学习与推理深度迁移,Physical AI 聚焦端到端实验效率的规模化提升。

面对行业全新趋势,我们完成了全栈产品与技术的体系化升级,全方位助力客户在 AI 加速的新时代保持核心竞争力。

在核心技术与产品层面,我们实现了四大维度的重磅突破:

  • 推出全模态训练框架 LoongForge,加速新一代的多模态大模型的迭代,一套框架覆盖 LLM、VLM、VLA、Diffusion 等不同场景,实现一套代码跑通GPU 与昆仑芯算力平台,训练效率领先行业 1 倍。
  • 自研面向 Agentic 模型的强化学习框架,原生支持 Agentic RL、OPD 等主流场景,训练效率提升 1 倍,大幅加速大模型与智能体的能力进化迭代。
  • 构建高效的推理系统。推出 vLLM-Kunlun,快速完成新模型在昆仑芯落地,Day0 支持了文心、GLM、MiMo 等模型。基于昆仑芯硬件特性开发专属算子,构建端到端量化体系,进一步提升模型推理性能。基于昆仑芯打造的 KV Cache 实现 90% 缓存命中率,实现大规模高效推理。
  • 针对具身智能场景,我们打造并集成了完整的研发工具链,覆盖了数据、开发训练、强化学习、推理等全链路,对全模态模型训练过程实现了深度优化和高保真的仿真环境,帮助具身企业加速算法迭代过程,多模态训练吞吐提升 1 到 5 倍。

此外,我们始终坚信,AI 的蓬勃发展,离不开开源生态的繁荣与技术的普惠。为此,我们将全面开源自研训练引擎,以技术成果反哺开源社区,持续助力全行业释放 AI 生产力。

我们已经正式开源全模态训练框架 LoongForge,期待大家的积极试用与宝贵反馈,让我们共同推动 AI 生态的繁荣。

面对新时代、新形势、新需求,我们对 AI 计算基础设施做了全面升级,今天我们正式发布百度百舸 6.0。

百度百舸 6.0,从算力平台升级为智能工厂,为客户提供端到端优化的 AI Infra,最大化提升 Token 效能,释放 AI 生产力。百度百舸 6.0 主要包含四大重磅亮点:

  • 第一,我们将于 6 月正式上线昆仑芯 256 超节点产品,为客户提供更强的国产算力;
  • 第二,Agentic 模型训推系统全面升级,支持 Agent 规模化落地和进化迭代;
  • 第三,具身智能研发全场景加速,加快具身实验效率和工程验证;
  • 第四,百度百舸 AI Stack 轻量 GPU 云,支持百卡集群轻量部署,让企业也能快速使用百舸产品。

产业级 Agent 正在进入分水岭:Agent 不仅要真正具备可持续执行任务的能力,还要让企业敢用、会管、交付有保障。

我们先看执行能力。Agent 要完成一个任务,本质上要跑通 ReAct Loop:

  • 第一步是思考,由模型能力进行支撑,完成意图理解、任务拆解和决策规划;
  • 第二步是行动,依靠沙箱和 Skill 调用工具、连接系统,把规划转化为真实执行;
  • 第三步是反馈,通过执行结果评估和会话记忆沉淀,不断修正路径、优化结果。

围绕这个闭环,我们构建了 Agent 原生的全栈基础设施:从模型、沙箱、网关,到安全、Skill、会话、可观测能力,形成了一套统一的 Agent 运行架构。这套架构既支撑了百度自身智能体的不断演进,也为客户快速构建专属智能体提供了统一的底座。

再看安全能力。Agent 时代,企业关注的重点是从「效率落地」走向「信任落地」。Agent 能否真正进入企业生产环境,不只取决于它能做多少事,更取决于企业是否看得清、管得住、敢放权。

围绕这一点,我们推出面向企业级 Agent 平台的 Agent 安全中心,以「看清楚、定边界」为核心,帮助企业构建起覆盖 Agent 运行时、Skill 生态和执行链路的安全可信体系。

我们核心解决的是企业最关心的两个问题:

  • 第一,Agent 运行时,能不能守住环境、凭证和操作边界,让每一次执行都安全可控;
  • 第二,Agent 调用 Skill、执行代码、处理内容时,能不能看清内容、代码和运行时的多维风险,并持续管控过程。只有把这两件事做好,企业才敢让 Agent 接入真实系统、承担真实任务。

百度智能云拥有从 Agent Infra、AI Infra,到多样化算力资源、海内外布局的全栈能力。我们支持 AI 进入真实业务、进入产业现场,也进入更广阔的物理世界:

一方面,我们帮助企业在电商运营、内容营销、客服售后等高频场景中,把 Agent 真正用起来、跑起来;另一方面,我们也在加速 Physical AI 的落地,支撑具身智能、汽车智驾这类前沿场景从技术验证走向产业应用。

具身智能是 AI 走向物理世界的关键场景,百度智能云已经走在这一领域的最前沿:我们在中国具身智能 AI 云市场排名第一,服务超过 30 家行业头部企业,加速具身智能产业发展。

每一次智能的跃迁,都在重新定义技术与产业的边界。

过去 3 年,我们共同见证了 AI 从识别、理解,到生成、创造。而今天,AI 正在跨越新的门槛------从生成内容,走向执行任务;从智能能力,走向智能生产力。智能时代,正在奔涌而来。

AI 云基础设施也不再只是算力与模型的承载平台,而是连接智能、产业与真实世界的关键底座。它将支撑 Agent 持续运行、可信交付,让智能生产力深入业务流程、产业现场和真实世界,成为推动千行百业跃迁的新力量。

新的生产力,呼唤新的时代底座。面向未来,百度智能云愿与所有客户和伙伴携手并肩,重构 AI 云基础设施,共赴更加辽阔的智能产业未来。谢谢大家!

相关推荐
具身智能之心1 小时前
RoboAlign-R1:对齐任务与物理规则!从 “画面生成” 到 “决策可用”
具身智能·wam·画面生成
我也曾把你举过头顶18 小时前
Skill/MCP/RAG/Agent/OpenClaw是什么
人工智能·ai agent·mcp
DogDaoDao1 天前
【GitHub】NousResearch/Hermes-Agent 深度技术解析:自我进化的AI Agent新范式
人工智能·深度学习·程序员·大模型·github·ai编程·ai agent
XD7429716361 天前
科技早报晚报|2026年5月14日:调试工作台、Agent 证据格式与多智能体编排,今晚更值得做成产品的 3 个技术机会
科技·ai agent·开发者工具·工程基础设施
玖日大大1 天前
2026十大LLM研究突破:扩散语言模型挑战自回归、Unicode隐形注入、AI操纵性评估 — 大模型从狂飙走向可控
人工智能·语言模型·回归·llm·论文解读·ai agent·ai安全
qcx232 天前
阿里 RynnVLA-002 源码深度拆解:一个 7B 模型如何同时当机器人大脑和世界模拟器
ai·机器人·llm·agent·具身智能·vla
曲幽2 天前
让 FastAPI Agent 思考不阻塞:手把手教你实现异步任务与后台处理方案
redis·python·agent·fastapi·web·async·celery·ai agent·backgroundtask
派拉软件2 天前
从身份重塑到运行可控:派拉 AIGS 如何构建 AI Agent 安全治理底座?
人工智能·安全·ai agent·ai 安全·ai身份与访问控制管理
enough_time3 天前
【无标题】
ai agent·mcp