看完 Google I/O 2026,我确信:多 Agent 时代不是概念了,Google 在造基础设施

大家好,我是子昕。

Google I/O 2026 开完了。

发的东西很多,信息量巨大。但我把 Keynote、官方博客、几家主流媒体报道全看完之后,脑子里就剩一个念头:

Google 不是在发布新模型,是在造 Agent 基础设施。

这次发的东西确实杂:新模型、新 agent、新搜索、新眼镜、新视频工具、新订阅方案。

但摆在一起看,其实在讲同一件事:

Google 在建一座 Agent 工厂。

模型是发动机。

Spark 是 24 小时不下班的值班员。

Antigravity 2.0 是调度中心。

Managed Agents API 是出厂接口。

计费从「你今天问了几次」改成「你用了多少算力」。

整条链路串起来了。

这篇不是发布会流水账。我只讲一件事:Google 的 Agent 基础设施,到底搭到了哪一层,跟 Anthropic 和 OpenAI 比怎么样。

这跟我之前写 Claude Code 的 Agent Teams、Codex 的 SubAgents 时的感觉一样:AI 工具正在从「一个聊天窗口」,变成「一群能干活的 agent」。

区别是,Google 这次直接把整座工厂的蓝图摊出来了。

先一张表建个全貌。

30 秒看完这次 I/O

发布 一句话说清楚 现在能用吗
Gemini 3.5 Flash 新主力模型,coding、agent、多模态 benchmark 超 3.1 Pro,输出快 4 倍 已上线
Gemini 3.5 Pro 更强的版本,还在内部测试 6 月推出
Gemini Spark 24/7 后台 AI agent,跑在云端虚拟机 本周 trusted testers,下周美国 Ultra Beta
Gemini Omni Flash 多模态生成,第一阶段做视频,强调多轮可控编辑 Gemini app(需订阅)/ YouTube Shorts(免费)
Antigravity 2.0 独立桌面应用,编排多个 agent 并行 已发布
Managed Agents API 一次 API 调用创建一个持久化 agent 已发布
Search 升级 搜索框重做 + Information agents 持续监控 + 代打电话预订 搜索框已推,agents 夏季推
计费改革 从每日 prompt 限额改成按算力计费 随 I/O 公布,逐步生效
Android XR 眼镜 Audio glasses,Samsung/Qualcomm/Gentle Monster 秋季上市

看完这张表你会发现,带 agent 字样的占了一大半

这不是巧合。

Agent 工厂的四个零件

我之前写 Claude Code Agent Teams 的时候说过一个判断:

AI 工具下一步拼的不是「回答更聪明」,而是谁能把任务接过去、拆开、跑完、交回来。

Google 这次等于把这件事拆成了四层,每层都给了方案。

第一层:发动机------Gemini 3.5 Flash

agent 跑任务,底下需要一个又快又不笨的模型。

Flash 3.5 就是干这个的。

官方说 coding、agentic、多模态 benchmark 都超过了上一代 Gemini 3.1 Pro。

输出速度号称比其他前沿模型快 4 倍。

快 4 倍这个数字,聊天场景感知不强。

但 agent 场景完全不一样。

一个 agent 跑任务,可能连续调用模型几十上百次。

每次快 4 倍,累积下来就是任务总时长的巨大差距。

所以 Flash 3.5 的速度优势,不是给你聊天用的。

是给 agent 高频调用用的。

Gemini 3.5 Pro 还没放出来,说 6 月。等着看。

第二层:值班员------Gemini Spark

这个我觉得是这次最值得盯的。

Spark 不是聊天机器人。

它是一个 24/7 运行的个人 AI agent。

跑在 Google Cloud 的专用虚拟机上。

不在你电脑上。

不需要你开着页面。

你关机了,它还在干。

底层用的是 Gemini 3.5 + Antigravity harness。

首批能接:Gmail、Docs、Slides。

后面通过 MCP(一种让不同 AI 工具互相连接的开放协议,Anthropic 提出的)接第三方:Canva、OpenTable、Instacart。

用大白话说:以前的 AI 是你打开一个窗口,问一句,它答一句。

Spark 是你布置一个任务,关掉电脑,明天早上起来看结果。

但冷水得泼。

Spark 现在还不能当成熟产品看。

本周先给 trusted testers。

下周面向美国 Google AI Ultra 用户开 Beta。

好不好用就看三件事:

第一,长任务能不能跑完不崩。

第二,花钱、发邮件这种高风险动作,是不是真的会停下来问你。

第三,MCP 第三方连接稳不稳。

之前太多 agent 的 demo 很顺,实际卡在登录、权限、工具调用失败上。

所以这个我重点关注,不急着吹。

第三层:调度中心------Antigravity 2.0

Antigravity 2.0 变成独立桌面应用了。

不是 IDE 插件。

是一个专门编排多个 agent 的东西。

支持子 agent 并行、后台 scheduled tasks、跟 AI Studio / Android / Firebase 集成。

如果你用过 Claude Code 的 Agent Teams 或者 Codex 的 SubAgents,这个概念你不陌生:

以后写代码不是一个模型从头干到尾。

而是派一堆 agent 分头干。

一个读需求。

一个搜项目结构。

一个写后端。

一个写前端。

一个跑测试。

最后一个汇总修正。

Claude Code 的 Agent Teams 是在终端里编排。

Codex Web 的 SubAgents 是在云端异步跑,Codex CLI 的 SubAgents 是在本地。

Google 的 Antigravity 2.0 是在桌面应用里集中调度,执行在云端。

第四层:出厂接口------Managed Agents API

对开发者来说,这个可能是最有想象空间的。

Managed Agents API:一次调用,就能创建一个 agent。

这个 agent 能推理、用工具、执行代码。

跑在隔离的 Linux 环境里。

最关键的:状态可以持久化。

文件留着。

环境留着。

交互状态留着。

下次接着跑。

很多 agent 不好用,不是模型笨。

是每次重启都失忆。环境一重置,前面的准备全白费。

用过 Claude Code Agent Teams 编排复杂任务的人,一定踩过这个坑。

Managed Agents 本质上是把你手动编排的事,变成了一次 API 调用。

Google 真把这个做顺的话,想象空间很大。

计费革命:Agent 时代的经济学

这次有个变化不太起眼,但对开发者钱包影响最大。

Gemini app 从每日 prompt 限额,转向 compute-used 模型。

不再是「你今天问了多少次」。

而是「你用了多少算力」。

复杂 prompt、多模态、长对话、高级功能,消耗不一样。

限额每 5 小时刷新,刷到周限额为止。

Pro 和 Ultra 用户还能买额外的 AI credits。

为什么改?

因为 agent 时代成本结构变了。

聊天是一问一答,成本可预测。

agent 不一样。

一个后台 agent 可能跑几个小时,查网页、调工具、执行代码、生成文件。

一个 Spark 任务消耗的算力,可能顶你聊一百轮。

按次数收费撑不住。

新的订阅档位:

档位 月费 用量 说明
Google AI Ultra(新) $100 Pro 的 5 倍 含 20TB 存储 + YouTube Premium
Google AI Ultra(旧顶级) 250) Pro 的 20 倍 保留原能力

$100 一个月。

Claude Max 起步也是 200。

ChatGPT Pro 是 $200。

Google 选了跟 Claude 同样的入门价位,但用量给得不一样。

定价策略很清楚:低价拉你进来体验 agent,用习惯了再往上走。

我觉得这个方向是对的。

后面 OpenAI、Anthropic 大概率也得走「按算力分层」这条路。

AI 产品从「会员功能」变成「算力额度」,迟早的事。

快速扫描:其他值得知道的

Search:不只是搜索框变了

Google 说这是 25 年来搜索框最大的升级。

新搜索框支持更长的问题,也支持丢图片、文件、视频、Chrome 标签页进去。

但搜索框变了不是最重要的。

重要的是 Information agents。

你可以让 Search 在后台 24 小时帮你盯一个信息。

租房、球鞋发售、股票、行业动态。

它自动监控网页、新闻、社交、实时数据,整理完推给你。

搜索从「查一次」变成「帮你盯着」。

这东西夏季先面向 AI Pro 和 Ultra 用户推。

另外 Search 还能处理预订,部分分类里能代你打电话给商家。

又是一个 agent。

Gemini Omni:视频能改才是真本事

多模态生成模型,第一阶段做视频。

能生成视频不稀奇。

多轮改才稀奇。

你生成一段视频,想改镜头。以前的工具:重新生成,人物变了,场景变了,啥都对不上。

Omni 说它能做到角色一致、物理一致、上下文连贯的多轮编辑。

改视频像改文档。

「镜头换成俯拍。」

「衣服换蓝色。」

「节奏快一点。」

真做到了的话,短视频创作者会疯的。

跟开发者关系不大,但跟内容创作关系很大。

价格、时长限制、版权限制都没定。等 API 出来再说。

Android XR 眼镜

跟 Samsung、Qualcomm、Gentle Monster 合作,先出 audio glasses,秋季上市。跟 agent 的关系是:Gemini 在后台跑多步骤任务,通过眼镜跟你交互。

具体好不好用,等价格和续航出来再说。

规模数据

Gemini app 9 亿月活,AI Mode 10 亿月活,850 万开发者在用,API 每分钟 190 亿 tokens。

说白了就一件事:Google 做 agent 的底气不是模型最强,是入口最多。Gemini 直接长在 Search、Gmail、YouTube、Chrome、Android 里,不需要重新抢入口。

三家 Agent 路线,正在分道扬镳

看完这次 I/O,再回头看 Anthropic 和 OpenAI 最近的动作,有个感觉越来越清晰了:

三家的 Agent 路线,走出了完全不同的方向。

Anthropic 的 Claude Code,强在开发者体感。

agent 在你终端里跑,你能看到它在干什么,随时能打断,上下文都在你手里。

Agent Teams 的多 agent 编排也是在本地完成的。

对开发者来说,掌控感最强。

OpenAI 的 Codex,更偏云端异步 Agent 模式。

你提交一个任务,它在云端沙箱里跑,跑完把结果给你。

SubAgent 之间也是 manager-worker 的并行 orchestration,更像云端 worker system。

优势是不占你本地资源,劣势是黑盒感强,调试不太方便。

Google 这次亮出的方案,像是想两头都要。

编排在本地(Antigravity 桌面应用),执行在云端(Managed Agents 的持久化 VM)。

而且是目前方案最完整地同时做到多 agent 并行 + 环境持久化的。

还有一个被低估的信号:MCP。

MCP 是 Anthropic 提出的开放协议。

Google 这次宣布 Spark 和 Managed Agents 都支持 MCP。

这意味着什么?

你写一套 MCP server,可以同时给 Claude Code 和 Gemini 用。

对开发者来说,MCP 正在变成 agent 时代的 USB 接口。

不管后面谁赢,MCP 生态的投入大概率不会白费。

我的判断

坦白说,这次 I/O 给我的感觉不是「又发了几个新模型」。

是 Google 终于把 Agent 基础设施的完整蓝图亮出来了。

发动机、值班员、调度中心、出厂接口、计费体系,一整条链。

但蓝图归蓝图。

demo 归 demo,实测归实测。

短期看,开发者日常编码,Claude Code 和 Codex 体感还是最好的。

本地执行、上下文感知、MCP 生态最成熟,这些不是一场发布会能追上的。

如果你现在在用 Claude Code,短期不用换。但建议把工具链 MCP 化------优先把 CI/CD、数据库查询、内部 API 封装成 MCP server,这几个复用率最高。不管后面哪家赢,你的 MCP server 都能复用。

中期要看 Spark 和 Managed Agents 的真实完成率。长任务跑不跑得稳,持久化环境靠不靠谱。

长期我盯两个东西:

第一,Gemini 3.5 Pro 出来之后 coding 能力什么水平。模型是 agent 的发动机,发动机不行,工厂再漂亮也白搭。

第二,MCP 就是事实标准。开发者现在投 MCP,是最安全的长期下注。

2026 年的 AI 竞争,不是比谁的模型更聪明,是比谁的 Agent 跑得更久、接得更多、崩得更少。

Google 把整座 Agent 工厂的蓝图摊开了。

能不能造出来,走着看。

你现在主力用哪个 AI 编程工具?Claude Code、Codex、还是别的?评论区聊聊。

更多内容,欢迎关注微信公众号【子昕AI编程】~

相关推荐
极品小學生1 小时前
拆解大模型时代的“流量交通枢纽”:API 中转站架构与核心原理
ai·架构·ai编程
uccs1 小时前
Agent循环原理
agent·ai编程·claude
盼君2 小时前
AI生成了网页,怎么部署上线?从零到HTTPS全流程实录
ai编程
深度先生2 小时前
01 Chroma_环境与uv极速起手
ai编程
codingWhat2 小时前
让AI来帮团队code review,我是这样做的(已开源)
ai编程
谷雨不太卷3 小时前
opencode的Skills
ai编程
qq_311674253 小时前
GPT5.5 token地址
ai编程
sugar__salt3 小时前
从Prompt到3D世界:用大模型精准构建你的迷你村庄
3d·ai·prompt·ai编程
peakmain93 小时前
基于 Hilt 实现 Android 网络库可插拔替换 Skill
android·架构·ai编程