看完 Google I/O 2026，我确信：多 Agent 时代不是概念了，Google 在造基础设施

大家好，我是子昕。

Google I/O 2026 开完了。

发的东西很多，信息量巨大。但我把 Keynote、官方博客、几家主流媒体报道全看完之后，脑子里就剩一个念头：

Google 不是在发布新模型，是在造 Agent 基础设施。

这次发的东西确实杂：新模型、新 agent、新搜索、新眼镜、新视频工具、新订阅方案。

但摆在一起看，其实在讲同一件事：

Google 在建一座 Agent 工厂。

模型是发动机。

Spark 是 24 小时不下班的值班员。

Antigravity 2.0 是调度中心。

Managed Agents API 是出厂接口。

计费从「你今天问了几次」改成「你用了多少算力」。

整条链路串起来了。

这篇不是发布会流水账。我只讲一件事：Google 的 Agent 基础设施，到底搭到了哪一层，跟 Anthropic 和 OpenAI 比怎么样。

这跟我之前写 Claude Code 的 Agent Teams、Codex 的 SubAgents 时的感觉一样：AI 工具正在从「一个聊天窗口」，变成「一群能干活的 agent」。

区别是，Google 这次直接把整座工厂的蓝图摊出来了。

先一张表建个全貌。

30 秒看完这次 I/O

发布	一句话说清楚	现在能用吗
Gemini 3.5 Flash	新主力模型，coding、agent、多模态 benchmark 超 3.1 Pro，输出快 4 倍	已上线
Gemini 3.5 Pro	更强的版本，还在内部测试	6 月推出
Gemini Spark	24/7 后台 AI agent，跑在云端虚拟机	本周 trusted testers，下周美国 Ultra Beta
Gemini Omni Flash	多模态生成，第一阶段做视频，强调多轮可控编辑	Gemini app（需订阅）/ YouTube Shorts（免费）
Antigravity 2.0	独立桌面应用，编排多个 agent 并行	已发布
Managed Agents API	一次 API 调用创建一个持久化 agent	已发布
Search 升级	搜索框重做 + Information agents 持续监控 + 代打电话预订	搜索框已推，agents 夏季推
计费改革	从每日 prompt 限额改成按算力计费	随 I/O 公布，逐步生效
Android XR 眼镜	Audio glasses，Samsung/Qualcomm/Gentle Monster	秋季上市

看完这张表你会发现，带 agent 字样的占了一大半。

这不是巧合。

Agent 工厂的四个零件

我之前写 Claude Code Agent Teams 的时候说过一个判断：

AI 工具下一步拼的不是「回答更聪明」，而是谁能把任务接过去、拆开、跑完、交回来。

Google 这次等于把这件事拆成了四层，每层都给了方案。

第一层：发动机------Gemini 3.5 Flash

agent 跑任务，底下需要一个又快又不笨的模型。

Flash 3.5 就是干这个的。

官方说 coding、agentic、多模态 benchmark 都超过了上一代 Gemini 3.1 Pro。

输出速度号称比其他前沿模型快 4 倍。

快 4 倍这个数字，聊天场景感知不强。

但 agent 场景完全不一样。

一个 agent 跑任务，可能连续调用模型几十上百次。

每次快 4 倍，累积下来就是任务总时长的巨大差距。

所以 Flash 3.5 的速度优势，不是给你聊天用的。

是给 agent 高频调用用的。

Gemini 3.5 Pro 还没放出来，说 6 月。等着看。

第二层：值班员------Gemini Spark

这个我觉得是这次最值得盯的。

Spark 不是聊天机器人。

它是一个 24/7 运行的个人 AI agent。

跑在 Google Cloud 的专用虚拟机上。

不在你电脑上。

不需要你开着页面。

你关机了，它还在干。

底层用的是 Gemini 3.5 + Antigravity harness。

首批能接：Gmail、Docs、Slides。

后面通过 MCP（一种让不同 AI 工具互相连接的开放协议，Anthropic 提出的）接第三方：Canva、OpenTable、Instacart。

用大白话说：以前的 AI 是你打开一个窗口，问一句，它答一句。

Spark 是你布置一个任务，关掉电脑，明天早上起来看结果。

但冷水得泼。

Spark 现在还不能当成熟产品看。

本周先给 trusted testers。

下周面向美国 Google AI Ultra 用户开 Beta。

好不好用就看三件事：

第一，长任务能不能跑完不崩。

第二，花钱、发邮件这种高风险动作，是不是真的会停下来问你。

第三，MCP 第三方连接稳不稳。

之前太多 agent 的 demo 很顺，实际卡在登录、权限、工具调用失败上。

所以这个我重点关注，不急着吹。

第三层：调度中心------Antigravity 2.0

Antigravity 2.0 变成独立桌面应用了。

不是 IDE 插件。

是一个专门编排多个 agent 的东西。

支持子 agent 并行、后台 scheduled tasks、跟 AI Studio / Android / Firebase 集成。

如果你用过 Claude Code 的 Agent Teams 或者 Codex 的 SubAgents，这个概念你不陌生：

以后写代码不是一个模型从头干到尾。

而是派一堆 agent 分头干。

一个读需求。

一个搜项目结构。

一个写后端。

一个写前端。

一个跑测试。

最后一个汇总修正。

Claude Code 的 Agent Teams 是在终端里编排。

Codex Web 的 SubAgents 是在云端异步跑，Codex CLI 的 SubAgents 是在本地。

Google 的 Antigravity 2.0 是在桌面应用里集中调度，执行在云端。

第四层：出厂接口------Managed Agents API

对开发者来说，这个可能是最有想象空间的。

Managed Agents API：一次调用，就能创建一个 agent。

这个 agent 能推理、用工具、执行代码。

跑在隔离的 Linux 环境里。

最关键的：状态可以持久化。

文件留着。

环境留着。

交互状态留着。

下次接着跑。

很多 agent 不好用，不是模型笨。

是每次重启都失忆。环境一重置，前面的准备全白费。

用过 Claude Code Agent Teams 编排复杂任务的人，一定踩过这个坑。

Managed Agents 本质上是把你手动编排的事，变成了一次 API 调用。

Google 真把这个做顺的话，想象空间很大。

计费革命：Agent 时代的经济学

这次有个变化不太起眼，但对开发者钱包影响最大。

Gemini app 从每日 prompt 限额，转向 compute-used 模型。

不再是「你今天问了多少次」。

而是「你用了多少算力」。

复杂 prompt、多模态、长对话、高级功能，消耗不一样。

限额每 5 小时刷新，刷到周限额为止。

Pro 和 Ultra 用户还能买额外的 AI credits。

为什么改？

因为 agent 时代成本结构变了。

聊天是一问一答，成本可预测。

agent 不一样。

一个后台 agent 可能跑几个小时，查网页、调工具、执行代码、生成文件。

一个 Spark 任务消耗的算力，可能顶你聊一百轮。

按次数收费撑不住。

新的订阅档位：

档位	月费	用量	说明
Google AI Ultra（新）	$100	Pro 的 5 倍	含 20TB 存储 + YouTube Premium
Google AI Ultra（旧顶级）	250）	Pro 的 20 倍	保留原能力

$100 一个月。

Claude Max 起步也是 200。

ChatGPT Pro 是 $200。

Google 选了跟 Claude 同样的入门价位，但用量给得不一样。

定价策略很清楚：低价拉你进来体验 agent，用习惯了再往上走。

我觉得这个方向是对的。

后面 OpenAI、Anthropic 大概率也得走「按算力分层」这条路。

AI 产品从「会员功能」变成「算力额度」，迟早的事。

快速扫描：其他值得知道的

Search：不只是搜索框变了

Google 说这是 25 年来搜索框最大的升级。

新搜索框支持更长的问题，也支持丢图片、文件、视频、Chrome 标签页进去。

但搜索框变了不是最重要的。

重要的是 Information agents。

你可以让 Search 在后台 24 小时帮你盯一个信息。

租房、球鞋发售、股票、行业动态。

它自动监控网页、新闻、社交、实时数据，整理完推给你。

搜索从「查一次」变成「帮你盯着」。

这东西夏季先面向 AI Pro 和 Ultra 用户推。

另外 Search 还能处理预订，部分分类里能代你打电话给商家。

又是一个 agent。

Gemini Omni：视频能改才是真本事

多模态生成模型，第一阶段做视频。

能生成视频不稀奇。

能多轮改才稀奇。

你生成一段视频，想改镜头。以前的工具：重新生成，人物变了，场景变了，啥都对不上。

Omni 说它能做到角色一致、物理一致、上下文连贯的多轮编辑。

改视频像改文档。

「镜头换成俯拍。」

「衣服换蓝色。」

「节奏快一点。」

真做到了的话，短视频创作者会疯的。

跟开发者关系不大，但跟内容创作关系很大。

价格、时长限制、版权限制都没定。等 API 出来再说。

Android XR 眼镜

跟 Samsung、Qualcomm、Gentle Monster 合作，先出 audio glasses，秋季上市。跟 agent 的关系是：Gemini 在后台跑多步骤任务，通过眼镜跟你交互。

具体好不好用，等价格和续航出来再说。

规模数据

Gemini app 9 亿月活，AI Mode 10 亿月活，850 万开发者在用，API 每分钟 190 亿 tokens。

说白了就一件事：Google 做 agent 的底气不是模型最强，是入口最多。Gemini 直接长在 Search、Gmail、YouTube、Chrome、Android 里，不需要重新抢入口。

三家 Agent 路线，正在分道扬镳

看完这次 I/O，再回头看 Anthropic 和 OpenAI 最近的动作，有个感觉越来越清晰了：

三家的 Agent 路线，走出了完全不同的方向。

Anthropic 的 Claude Code，强在开发者体感。

agent 在你终端里跑，你能看到它在干什么，随时能打断，上下文都在你手里。

Agent Teams 的多 agent 编排也是在本地完成的。

对开发者来说，掌控感最强。

OpenAI 的 Codex，更偏云端异步 Agent 模式。

你提交一个任务，它在云端沙箱里跑，跑完把结果给你。

SubAgent 之间也是 manager-worker 的并行 orchestration，更像云端 worker system。

优势是不占你本地资源，劣势是黑盒感强，调试不太方便。

Google 这次亮出的方案，像是想两头都要。

编排在本地（Antigravity 桌面应用），执行在云端（Managed Agents 的持久化 VM）。

而且是目前方案最完整地同时做到多 agent 并行 + 环境持久化的。

还有一个被低估的信号：MCP。

MCP 是 Anthropic 提出的开放协议。

Google 这次宣布 Spark 和 Managed Agents 都支持 MCP。

这意味着什么？

你写一套 MCP server，可以同时给 Claude Code 和 Gemini 用。

对开发者来说，MCP 正在变成 agent 时代的 USB 接口。

不管后面谁赢，MCP 生态的投入大概率不会白费。

我的判断

坦白说，这次 I/O 给我的感觉不是「又发了几个新模型」。

是 Google 终于把 Agent 基础设施的完整蓝图亮出来了。

发动机、值班员、调度中心、出厂接口、计费体系，一整条链。

但蓝图归蓝图。

demo 归 demo，实测归实测。

短期看，开发者日常编码，Claude Code 和 Codex 体感还是最好的。

本地执行、上下文感知、MCP 生态最成熟，这些不是一场发布会能追上的。

如果你现在在用 Claude Code，短期不用换。但建议把工具链 MCP 化------优先把 CI/CD、数据库查询、内部 API 封装成 MCP server，这几个复用率最高。不管后面哪家赢，你的 MCP server 都能复用。

中期要看 Spark 和 Managed Agents 的真实完成率。长任务跑不跑得稳，持久化环境靠不靠谱。

长期我盯两个东西：

第一，Gemini 3.5 Pro 出来之后 coding 能力什么水平。模型是 agent 的发动机，发动机不行，工厂再漂亮也白搭。

第二，MCP 就是事实标准。开发者现在投 MCP，是最安全的长期下注。

2026 年的 AI 竞争，不是比谁的模型更聪明，是比谁的 Agent 跑得更久、接得更多、崩得更少。

Google 把整座 Agent 工厂的蓝图摊开了。

能不能造出来，走着看。

你现在主力用哪个 AI 编程工具？Claude Code、Codex、还是别的？评论区聊聊。

更多内容，欢迎关注微信公众号【子昕AI编程】~