随着 AI 从回答问题迈向自主执行和创造,行业开始进入真正的 Agentic AI 落地元年。这不仅改变了应用形态,也正在重塑整个 AI 技术栈的底层逻辑。
与此同时,智能体体系结构的复杂度呈指数级增长,从任务规划、工具调用到长期记忆,每一环节都对底层框架提出了更高要求。对此,PPIO 联合创始人兼 CEO 姚欣表示:
能看到无论是 PC 时代,还是移动时代、云时代,操作系统才是最核心的中间层。
这意味着,未来的 AI 应用将从回答问题的工具转向能够直接完成任务的助手,而要承载这类能力,行业迫切需要一种新的基础设施------Agent 时代的操作系统。
在本次量子位 MEET2026 智能未来大会上,姚欣围绕智能体演进、Agent Infra 等关键词分享了自己对 AI 底层基础设施架构重塑的判断:
今天的 Agent 会成为未来 AI 应用的主力,而 Agent Infra 会成为下一个 AI 时代的操作系统。
无论模型能力如何提升,无论应用形态如何演进,未来趋势都指向同一个目标:在 AI 时代,通过新的 Runtime 体系,实现模型能力、工具能力与执行能力的高度融合。

为了完整体现姚欣的思考,在不改变原意的基础上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启发。
MEET2026 智能未来大会是由量子位主办的行业峰会,20 余位产业代表与会讨论。线下参会观众 1000+,线上直播观众 320 万 +,获得了主流媒体的广泛关注与报道。
核心观点梳理
-
AI 不再只是回答问题的工具,而能像智能体一样,自动化地比价、下单、执行任务,整个生态正在从 "生成" 走向"执行"。
-
当前很多产品把工作流、编排工具当作 Agent,但这只是早期形态,真正的智能体需要自主分析、决策与执行。
-
传统 AI 工具只是增强搜索或处理能力,并不能支撑完整的智能体运行;真正的 Agent 需要新的系统架构支撑,不能依赖旧式应用或工作流体系。
-
模型能力决定上限,但智能体能否跑起来、能否在各种环境里通用落地,关键在于 Runtime。
以下为姚欣演讲全文:
AI 从生成式迈向 Agent 时代
大家好,我今天分享的主题也是很多嘉宾讲的新话题 Agentic AI------今年 AI 进入了到一个全新的时代。
过去一周,豆包手机横空出世,它能够自动帮你下单、比价、执行任务,这正是我们今年所看到的------从 Generative AI 向 Agent AI 的进步。
AI 以前更多只是做一些聊天、回答问题;而从年初的 Manus、Genspark,到现在的豆包手机,这些产品越来越清晰地展示出 AI 应用开始像智能体一样自动化完成任务和进行创作。

今天提到智能体这个话题的时候,我发现行业内,特别国内很多人把它定位成工作流。
以前像扣子那样的编排工具,只能算是最早期的智能体形态,并不是完全体。
今天真正的完全态智能体需要具备自主分析、自主决策以及自动化完成任务的能力,而执行与落地正是其中的关键环节。
同时,我们之前在很多 AI 工具中看到的 Deep Research 功能,虽然能帮助做搜索和处理,但我认为这仍然只是智能体的早期阶段,真正的智能体需要全新的架构和全新的形态。
真正的智能体需要从能力堆叠走向系统化结构
2023 年的时候,OpenAI 研究员 LilianWeng 也发了一篇很著名的论文,《LLM Powered Autonomous Agents》。
这篇文章里面揭示了真正的智能体有哪些核心的组件,包括四个核心的元素:Memory、Planning、Tools、Action。

在梳理每个核心组件的特点和特性时,发现了这样一些类比:如果把智能体当作数字生命体,那么 Memory 有点像大脑的记忆功能,负责短期记忆、长期记忆,甚至需要具备遗忘能力;Planning 更像思考单元,能够进行深度推理和深度分析。
Tools、Action 则更像我们的五官,能够感知外部世界发生了什么,甚至像手和脚一样去影响和改造外部世界。真正的智能体不仅是执行的机器,更重要的是具备从思考到执行再到分析的一整套综合系统。
我们想一想,什么样的系统是既能做资源的管理又能做记忆的管理,甚至调用大量的工具呢?
我认为今天的智能体的基础设施更像以前的操作系统,这里我列举了一下过去三四十年一系列操作系统的发展和诞生,能看到无论从 PC 时代到移动时代还是到云时代,操作系统才是最核心的中间层。

一方面,它要管理大量不同的异构资源,把计算资源、硬件资源,以及各类异构的记忆、存储、传输能力整合起来。
另一方面,还需要把这些能力抽离并抽象成标准化的功能调用,暴露给上层应用,让开发者可以轻松进行二次开发,而无需针对每一种硬件结构单独开发。
无论是在 PC 时代、手机时代,还是云时代,操作系统始终扮演着这样的角色。
Agent Infra:未来 AI 时代的新操作系统
我提出一个看法:今天我们做的 Agent Infra,本质上是在构建 AI 时代的操作系统。
传统操作系统管理 CPU、内存、存储等硬件资源,而 Agent Infra 管理的是模型能力 、工具调用能力 ,以及任务和执行能力,在这个维度上完成资源管理、统一调度与抽象,让上层开发者能够更方便地进行应用构建。
在整个 Agent Infra 体系中,最核心的部分我们认为是 Runtime。
Runtime 解决的是 "能不能跑起来" 的问题,真正的智能体能否在各种环境下大规模、通用地适配并稳定运行,依赖的正是把不同能力进行综合调度的 Runtime,这也是 Agent Infra 的核心所在。

PPIO 是一家 AI 云计算公司,我们从底层算力到 IaaS、PaaS,再到 MaaS,逐层构建了完整的 AI 云能力,为 Agent Infra 提供底座支撑。

自 2020 年算力出现短缺开始,我们整合大量数据中心闲置算力,构建分布式算力网络。如今我们在中国已有 4000 + 算力节点 、1300 多个能提供大量分布式算力的合作伙伴;2023 年从 CPU 扩展到 GPU;2024 年我们在全球六大洲三十多个地区和国家开始部署算力网络能力,整合全球各地的算力资源,这是我们的第一层。
第二层是 GPU 推理云平台。2023 年我们打造了第一代推理云平台 ,实现异构算力的统一调度。2024 年推出分布式推理引擎,并托管近百个开源与社区模型,每天处理接近 2000 亿 Token,为模型提供推理加速、降本和性能增强,是支撑开源模型落地的重要基础。
基于前期积累,我们在今年 WAIC 发布了首个兼容 E2B 的 Agent 沙箱,以 Runtime 为核心整合模型调用、短期 / 长期记忆和数据库能力,帮助头部 Agent 厂商规模化落地,通过更安全、敏捷的沙箱体系降低错误率。
该沙箱是专为 Agent 执行任务设计的云端运行环境,为 Agent 赋予安全可靠、高效敏捷的 "手和脚",沙箱内支持动态调用 Browser use、Computer use、MCP、RAG、Search 等各种工具。

PPIO Agent 沙箱基于 Firecracker MicroVM 构建,具备强安全隔离、毫秒级极速启动、高并发创建三大特性,无需预部署,即启即用,让 Agent 的所有操作均处于 "受限、可控" 的状态。
强安全隔离,让不同 Agent 沙箱的环境可实现完全隔离,当多个任务并发执行时,每个任务都能在独立环境中运行,从根源上避免数据泄漏和资源抢占冲突。
小于 200ms 的极速启动时间,远远小于传统虚拟机沙箱数分钟甚至更长的时效,可瞬间创建沙箱环境、运行生成的代码并展示预览效果,大幅提升用户的开发流畅度。
并且 PPIO Agent 沙箱还支持同时快速启动数千个沙箱实例的高并发创建能力,可充分满足业务场景中的高并发需求,加快结果交付速度,保障用户体验。
沙箱上线以来,月度活跃数在持续增长,我们希望通过 Agent Infra 成为 AI 时代新的操作系统,帮助更多开发者成长与创业。
欢迎在评论区留下你的想法!
--- 完 ---