大家好,我是子昕。
Google I/O 2026 开完了。
发的东西很多,信息量巨大。但我把 Keynote、官方博客、几家主流媒体报道全看完之后,脑子里就剩一个念头:
Google 不是在发布新模型,是在造 Agent 基础设施。
这次发的东西确实杂:新模型、新 agent、新搜索、新眼镜、新视频工具、新订阅方案。
但摆在一起看,其实在讲同一件事:
Google 在建一座 Agent 工厂。
模型是发动机。
Spark 是 24 小时不下班的值班员。
Antigravity 2.0 是调度中心。
Managed Agents API 是出厂接口。
计费从「你今天问了几次」改成「你用了多少算力」。
整条链路串起来了。
这篇不是发布会流水账。我只讲一件事:Google 的 Agent 基础设施,到底搭到了哪一层,跟 Anthropic 和 OpenAI 比怎么样。
这跟我之前写 Claude Code 的 Agent Teams、Codex 的 SubAgents 时的感觉一样:AI 工具正在从「一个聊天窗口」,变成「一群能干活的 agent」。
区别是,Google 这次直接把整座工厂的蓝图摊出来了。
先一张表建个全貌。
30 秒看完这次 I/O
| 发布 | 一句话说清楚 | 现在能用吗 |
|---|---|---|
| Gemini 3.5 Flash | 新主力模型,coding、agent、多模态 benchmark 超 3.1 Pro,输出快 4 倍 | 已上线 |
| Gemini 3.5 Pro | 更强的版本,还在内部测试 | 6 月推出 |
| Gemini Spark | 24/7 后台 AI agent,跑在云端虚拟机 | 本周 trusted testers,下周美国 Ultra Beta |
| Gemini Omni Flash | 多模态生成,第一阶段做视频,强调多轮可控编辑 | Gemini app(需订阅)/ YouTube Shorts(免费) |
| Antigravity 2.0 | 独立桌面应用,编排多个 agent 并行 | 已发布 |
| Managed Agents API | 一次 API 调用创建一个持久化 agent | 已发布 |
| Search 升级 | 搜索框重做 + Information agents 持续监控 + 代打电话预订 | 搜索框已推,agents 夏季推 |
| 计费改革 | 从每日 prompt 限额改成按算力计费 | 随 I/O 公布,逐步生效 |
| Android XR 眼镜 | Audio glasses,Samsung/Qualcomm/Gentle Monster | 秋季上市 |
看完这张表你会发现,带 agent 字样的占了一大半。
这不是巧合。
Agent 工厂的四个零件
我之前写 Claude Code Agent Teams 的时候说过一个判断:
AI 工具下一步拼的不是「回答更聪明」,而是谁能把任务接过去、拆开、跑完、交回来。
Google 这次等于把这件事拆成了四层,每层都给了方案。
第一层:发动机------Gemini 3.5 Flash
agent 跑任务,底下需要一个又快又不笨的模型。
Flash 3.5 就是干这个的。
官方说 coding、agentic、多模态 benchmark 都超过了上一代 Gemini 3.1 Pro。
输出速度号称比其他前沿模型快 4 倍。
快 4 倍这个数字,聊天场景感知不强。
但 agent 场景完全不一样。
一个 agent 跑任务,可能连续调用模型几十上百次。
每次快 4 倍,累积下来就是任务总时长的巨大差距。
所以 Flash 3.5 的速度优势,不是给你聊天用的。
是给 agent 高频调用用的。
Gemini 3.5 Pro 还没放出来,说 6 月。等着看。
第二层:值班员------Gemini Spark
这个我觉得是这次最值得盯的。
Spark 不是聊天机器人。
它是一个 24/7 运行的个人 AI agent。
跑在 Google Cloud 的专用虚拟机上。
不在你电脑上。
不需要你开着页面。
你关机了,它还在干。
底层用的是 Gemini 3.5 + Antigravity harness。
首批能接:Gmail、Docs、Slides。
后面通过 MCP(一种让不同 AI 工具互相连接的开放协议,Anthropic 提出的)接第三方:Canva、OpenTable、Instacart。
用大白话说:以前的 AI 是你打开一个窗口,问一句,它答一句。
Spark 是你布置一个任务,关掉电脑,明天早上起来看结果。
但冷水得泼。
Spark 现在还不能当成熟产品看。
本周先给 trusted testers。
下周面向美国 Google AI Ultra 用户开 Beta。
好不好用就看三件事:
第一,长任务能不能跑完不崩。
第二,花钱、发邮件这种高风险动作,是不是真的会停下来问你。
第三,MCP 第三方连接稳不稳。
之前太多 agent 的 demo 很顺,实际卡在登录、权限、工具调用失败上。
所以这个我重点关注,不急着吹。
第三层:调度中心------Antigravity 2.0
Antigravity 2.0 变成独立桌面应用了。
不是 IDE 插件。
是一个专门编排多个 agent 的东西。
支持子 agent 并行、后台 scheduled tasks、跟 AI Studio / Android / Firebase 集成。
如果你用过 Claude Code 的 Agent Teams 或者 Codex 的 SubAgents,这个概念你不陌生:
以后写代码不是一个模型从头干到尾。
而是派一堆 agent 分头干。
一个读需求。
一个搜项目结构。
一个写后端。
一个写前端。
一个跑测试。
最后一个汇总修正。
Claude Code 的 Agent Teams 是在终端里编排。
Codex Web 的 SubAgents 是在云端异步跑,Codex CLI 的 SubAgents 是在本地。
Google 的 Antigravity 2.0 是在桌面应用里集中调度,执行在云端。
第四层:出厂接口------Managed Agents API
对开发者来说,这个可能是最有想象空间的。
Managed Agents API:一次调用,就能创建一个 agent。
这个 agent 能推理、用工具、执行代码。
跑在隔离的 Linux 环境里。
最关键的:状态可以持久化。
文件留着。
环境留着。
交互状态留着。
下次接着跑。
很多 agent 不好用,不是模型笨。
是每次重启都失忆。环境一重置,前面的准备全白费。
用过 Claude Code Agent Teams 编排复杂任务的人,一定踩过这个坑。
Managed Agents 本质上是把你手动编排的事,变成了一次 API 调用。
Google 真把这个做顺的话,想象空间很大。
计费革命:Agent 时代的经济学
这次有个变化不太起眼,但对开发者钱包影响最大。
Gemini app 从每日 prompt 限额,转向 compute-used 模型。
不再是「你今天问了多少次」。
而是「你用了多少算力」。
复杂 prompt、多模态、长对话、高级功能,消耗不一样。
限额每 5 小时刷新,刷到周限额为止。
Pro 和 Ultra 用户还能买额外的 AI credits。
为什么改?
因为 agent 时代成本结构变了。
聊天是一问一答,成本可预测。
agent 不一样。
一个后台 agent 可能跑几个小时,查网页、调工具、执行代码、生成文件。
一个 Spark 任务消耗的算力,可能顶你聊一百轮。
按次数收费撑不住。
新的订阅档位:
| 档位 | 月费 | 用量 | 说明 |
|---|---|---|---|
| Google AI Ultra(新) | $100 | Pro 的 5 倍 | 含 20TB 存储 + YouTube Premium |
| Google AI Ultra(旧顶级) | 250) | Pro 的 20 倍 | 保留原能力 |
$100 一个月。
Claude Max 起步也是 200。
ChatGPT Pro 是 $200。
Google 选了跟 Claude 同样的入门价位,但用量给得不一样。
定价策略很清楚:低价拉你进来体验 agent,用习惯了再往上走。
我觉得这个方向是对的。
后面 OpenAI、Anthropic 大概率也得走「按算力分层」这条路。
AI 产品从「会员功能」变成「算力额度」,迟早的事。
快速扫描:其他值得知道的
Search:不只是搜索框变了
Google 说这是 25 年来搜索框最大的升级。
新搜索框支持更长的问题,也支持丢图片、文件、视频、Chrome 标签页进去。
但搜索框变了不是最重要的。
重要的是 Information agents。
你可以让 Search 在后台 24 小时帮你盯一个信息。
租房、球鞋发售、股票、行业动态。
它自动监控网页、新闻、社交、实时数据,整理完推给你。
搜索从「查一次」变成「帮你盯着」。
这东西夏季先面向 AI Pro 和 Ultra 用户推。
另外 Search 还能处理预订,部分分类里能代你打电话给商家。
又是一个 agent。
Gemini Omni:视频能改才是真本事
多模态生成模型,第一阶段做视频。
能生成视频不稀奇。
能多轮改才稀奇。
你生成一段视频,想改镜头。以前的工具:重新生成,人物变了,场景变了,啥都对不上。
Omni 说它能做到角色一致、物理一致、上下文连贯的多轮编辑。
改视频像改文档。
「镜头换成俯拍。」
「衣服换蓝色。」
「节奏快一点。」
真做到了的话,短视频创作者会疯的。
跟开发者关系不大,但跟内容创作关系很大。
价格、时长限制、版权限制都没定。等 API 出来再说。
Android XR 眼镜
跟 Samsung、Qualcomm、Gentle Monster 合作,先出 audio glasses,秋季上市。跟 agent 的关系是:Gemini 在后台跑多步骤任务,通过眼镜跟你交互。
具体好不好用,等价格和续航出来再说。
规模数据
Gemini app 9 亿月活,AI Mode 10 亿月活,850 万开发者在用,API 每分钟 190 亿 tokens。
说白了就一件事:Google 做 agent 的底气不是模型最强,是入口最多。Gemini 直接长在 Search、Gmail、YouTube、Chrome、Android 里,不需要重新抢入口。
三家 Agent 路线,正在分道扬镳
看完这次 I/O,再回头看 Anthropic 和 OpenAI 最近的动作,有个感觉越来越清晰了:
三家的 Agent 路线,走出了完全不同的方向。

Anthropic 的 Claude Code,强在开发者体感。
agent 在你终端里跑,你能看到它在干什么,随时能打断,上下文都在你手里。
Agent Teams 的多 agent 编排也是在本地完成的。
对开发者来说,掌控感最强。
OpenAI 的 Codex,更偏云端异步 Agent 模式。
你提交一个任务,它在云端沙箱里跑,跑完把结果给你。
SubAgent 之间也是 manager-worker 的并行 orchestration,更像云端 worker system。
优势是不占你本地资源,劣势是黑盒感强,调试不太方便。
Google 这次亮出的方案,像是想两头都要。
编排在本地(Antigravity 桌面应用),执行在云端(Managed Agents 的持久化 VM)。
而且是目前方案最完整地同时做到多 agent 并行 + 环境持久化的。
还有一个被低估的信号:MCP。
MCP 是 Anthropic 提出的开放协议。
Google 这次宣布 Spark 和 Managed Agents 都支持 MCP。
这意味着什么?
你写一套 MCP server,可以同时给 Claude Code 和 Gemini 用。
对开发者来说,MCP 正在变成 agent 时代的 USB 接口。
不管后面谁赢,MCP 生态的投入大概率不会白费。
我的判断
坦白说,这次 I/O 给我的感觉不是「又发了几个新模型」。
是 Google 终于把 Agent 基础设施的完整蓝图亮出来了。
发动机、值班员、调度中心、出厂接口、计费体系,一整条链。
但蓝图归蓝图。
demo 归 demo,实测归实测。
短期看,开发者日常编码,Claude Code 和 Codex 体感还是最好的。
本地执行、上下文感知、MCP 生态最成熟,这些不是一场发布会能追上的。
如果你现在在用 Claude Code,短期不用换。但建议把工具链 MCP 化------优先把 CI/CD、数据库查询、内部 API 封装成 MCP server,这几个复用率最高。不管后面哪家赢,你的 MCP server 都能复用。
中期要看 Spark 和 Managed Agents 的真实完成率。长任务跑不跑得稳,持久化环境靠不靠谱。
长期我盯两个东西:
第一,Gemini 3.5 Pro 出来之后 coding 能力什么水平。模型是 agent 的发动机,发动机不行,工厂再漂亮也白搭。
第二,MCP 就是事实标准。开发者现在投 MCP,是最安全的长期下注。
2026 年的 AI 竞争,不是比谁的模型更聪明,是比谁的 Agent 跑得更久、接得更多、崩得更少。
Google 把整座 Agent 工厂的蓝图摊开了。
能不能造出来,走着看。
你现在主力用哪个 AI 编程工具?Claude Code、Codex、还是别的?评论区聊聊。
更多内容,欢迎关注微信公众号【子昕AI编程】~