聊一聊 Gemini3、 AntiGravity 和 Nano Banana Pro 的体验和问题

相信这两天大家应该都已经被 Gemini3 和 AntiGravity 刷屏了,特别昨晚谷歌还发布了 Nano Banana Pro ,可以说这两天几乎成了谷歌的 AI 专场,所以这里也介绍下这两天的体验,顺便简单介绍下大家上不去 AntiGravity 的问题。

Nano Banana Pro

其实相比起 coding,这次的 Nano Banana Pro 反而是我最关心的,比如这次让我感觉最有意思的 prompt 「1:1 真人版」就非常有意思,传入一张手办或者动漫图片,直出整体效果如下图所示:

同时,你还可以让它做一个 apple vision pro 2 的 hack 解构图,整个直出效果还是相当不错的:

如果通过 AI Studio 的 http://aistudio.google.com/apps/bundled/product_mockup ,你还通过简单的描述词,就能让它帮你生成各种不同风格的知识图谱或者关系图谱,这对于 PPT 或者内容创造来说,可以说是非常可观的效率提升了:

最后就是 AntiGravity + Banana Pro 的结合效果,是的,今天更新后的 AntiGravity 已经有 Nano Banana Pro 的效果了:

Web UI 理解和实现上确实比较明显的提升。

AntiGravity

接下来就是 AntiGravity ,相信大家应该都知道这次谷歌发布了 " Windsurf2.0" 的 IDE,基本功能和 UI 都有浓厚的 Windsurf 影子,也是基于 VSCode 的一个 IDE 产品:

为什么说是 Windsurf 2.0 ?哈哈哈哈,看看这些就知道了,毕竟是 Windsurf 的前核心团队做的:

先简单介绍下 Antigravity 的一些特点,核心就是 Agent-First ,它预设 AI 是一个能够自主规划、执行、验证和迭代复杂工程任务的执行者,主打特色有:

  • 并行工作: 与传统的线性聊天(等待 AI 回复)不同,可以同时派遣多个智能体(Agents)去处理不同的任务(例如一个修 Bug,一个写测试),并在"Mission Control"视图中监控进度。
  • 集成了一个深度绑定的 Chrome 浏览器,它除了写代码,还可以做很多其他的东西 ,智能体拥有一个专门的(Browser Subagent),可以像人类一样浏览网页、点击、输入、读取 DOM 和控制台日志,所以智能体可以自主查阅文档、搜索解决方案甚至测试 Web 应用

这里的 Browser Subagent 还挺有意思的,你可以让它帮你浏览某些网页,或者帮你汇总某些邮件,总结一些资料,查询最新的资讯之类,它会自己打开浏览器并完成对应任务:

那么,很多人要说,我都上不去卡在 loading,甚至就在下图这个地方一动不动,这是为什么呢?

首先就是,你要打开 https://policies.google.com/terms ,然后查看你的账号所在区域,如果是 HK ,那么你就需要先改地址了:

改地址链接是 https://policies.google.com/country-association-form ,你需要选「其他」 并填写理由,理由只能你自己想了,申请通过后,你就会看到类似的邮件回复:

最后,你还需要开全局 proxy,比如 win11 需要这两个全开(tun)比较保险,而 Mac是增强模式 :

进去后你就可以看到,提供的模型还是挺不错的,最重要是目前是 free :

在昨天的没更新的时候,模型很容易就 limit 了,更新到 1.1.3 之后情况大幅好转

不过 error 问题还是在的,经常遇到各种 Agent Error 只能说现在产品实现还是相对毛坯:

所以如果还没用上的也不急,等等更优秀。

最后还是提一句,Google 账号的地区和 Google Play 的地区有时候是两回事,Google Play 的地区需要在 Google Play 里修改,它影响的是 Google One 的购买权限,也就是 AI Pro , 比如最近的 Gemini AI Pro 通过 Google One 学生教育又可以续费一年。

而 Google 账号的地区,它影响的是 AntiGravity 这种的登录使用,这两者还是需要区分一下,当然正常来说应该两个都一样,只是说,你 Play 是 US ,不一定就是账号是 US 。

Gemini 3

先说问题,实际体验下来会发现它变得倔强了,它甚至会再多轮会话里反驳 prompt 中的要求,之前 2.5 是如果纠正的话它会立马调整,而 3 里它也会先肯定你,然后说还是该按照我的来 ,最离谱的是: 写的太详细的 prompt ,效果居然不如模糊的

当然,这次更新之后,Gemini 3 的 UI 能力就得到了不错的提升,比如这次我用 Gemini 3 update 了我的个人主页 https://guoshuyu.cn/home/index/ ,整体风格我还是挺喜欢的,特别是动态的背景键盘输入和右侧的 HUD terminal 输出效果:

另外 Gemini 3 的动态能力还体现在它新的「动态试图」上,通过它你可以直观感受到 Gemini 3 pro 的 UI 能力的提升:

例如以下都是通过 Gemini 3 pro 的动态试图,一句话直出的可交互视图效果:

还可以让他做一些范式示例,比如如果需要展示蒸汽机的基础原理,直接一句话就可以让它生成一个可交互的动态效果,这对于内容创作来说无疑方便很多:

你甚至可以说「https://juejin.cn/ 这个页面的 ui 太丑了,帮我优化个炫酷的效果」,然后你就可以得到如下图所示的 UI :

所有「动态视图」也是 Gemini 3 UI 绘制能力升级的体现,虽然目前只是实验性阶段,但是按照目前 AI 的爬升速度,相信接下来还会给我们更多的惊喜。

最后

最后,说再多都是虚的,自己体验下才知道,至少 AntiGravity 还是值得一试的,毕竟目前还是 Free 不是么?

相关推荐
一 乐2 小时前
英语学习激励|基于java+vue的英语学习交流平台系统小程序(源码+数据库+文档)
java·前端·数据库·vue.js·学习·小程序
淡淡蓝蓝2 小时前
uni.uploadFile使用PUT方法上传图片
开发语言·前端·javascript
晴殇i2 小时前
用户登录后,Token 到底该存哪里?从懵圈到精通的全方位解析
前端·面试
零一科技2 小时前
Vue3学习第七课:(Vuex 替代方案)Pinia 状态管理 5 分钟上手
前端·vue.js
吃饺子不吃馅2 小时前
受够了 create-xxx?我写了一个聚合主流框架的脚手架
前端·面试·架构
Achieve前端实验室2 小时前
深度解析 JavaScript 作用域与作用域链
前端·javascript·面试
不老刘2 小时前
在 Windows 系统上安装官方 Gemini CLI 教程
ai编程·gemini
讨厌下雨的天空2 小时前
缓冲区io
linux·服务器·前端
xhxxx3 小时前
《深入理解 JavaScript 对象:属性命名、访问与遍历的那些细节》
前端·javascript