【新智元导读】AI 圈最热的风头莫过于 GPT-4o 的原生图像,但别急着下定论。Gemini 2.5 Pro 正在悄悄反击,在 Chatbot 竞技场夺冠、IQ 测试拿下第一后,它还能解魔方、建模型、创游戏,甚至一键生成 3D 打印文件!AI 的下一个战场,正在从文字转向视觉与空间,谁能笑到最后?
要说这几天 AI 圈最火的模型,那肯定非 GPT-4o 莫属。
为了应对 DeepSeek V3 的一次「小升级」以及谷歌 Gemini 2.5 Pro 的推出,奥特曼带队上线了 GPT-4o 的原生图像生成功能。
随之而来的是一股吉卜力风席卷全网,火速出圈儿。
只留下谷歌在这股风中凌乱。。。
谷歌的这个旗舰模型真的这么不堪一击吗?
好像不是那么回事。
刚刚发布几天,Gemini 2.5 Pro 已经冲上了 Chatbot 竞技场榜首的位置,超越了最新更新的 ChatGPT-4o-latest 以及 Grok-3。
更离谱的是,在一项智商测试中,Gemini 2.5 Pro 的 IQ 竟然高达 130,离线得分也有 118 分。
均在所有模型中排名第一。
要知道人类平均智商为 100。
虽然不太全面,但至少在有些方面,AI 的确已经比大多数人聪明了!
这么厉害的模型都能干点啥,我们先来看看网友的脑洞。
从 3D 建模蛋糕到秒解魔方
DeepMind 的研究员 Fei Xia 在网上展示了如何用 Gemini 2.5 Pro 让一张图片活起来。
「Gemini 2.5 Pro 是一个强大的编码模型。我能够使用它将一张图片转换成 3D 打印对象,并使其活起来!」他表示。
他首先用 Gemini 2.0 Flash Image 将妻子画的三层蛋糕转换成 3D 渲染图。
Gemini 2.0 Flash 做得很好,添加了很多细节。
接着,他就让新发布的 Gemini 2.5 Pro 模型编写 OpenSCAD 代码来复制这个 3D 模型。
这个过程中还需要同时注意可打印性。
最后,点击打印按钮,就得到了一个可爱的玩具!
Fei 表示他非常喜欢所有的细节。
X 上的大 V Shruti Mishra 贴出了一些实测 Gemini 2.5 Pro 的震撼用例。
比如,使用 Three.js 创建一个 3D 汽车模拟器。
接下来是个老节目,旋转多边形和弹跳小球的动画。
实测中两个模型使用了相同的提示词。
不得不说,Gemini 2.5 Pro 与 GPT o1 Pro 表现得都很棒,o1 Pro 的小球还有一些动效。
Gemini 2.5 Pro 生成的小球可能更接近真实情况一些。
甚至创建出一个 Minecraft 游戏。
生成一个 3D 魔方,然后解开它。
你还可以调整魔方的阶数。
轻松制作一个高尔顿板模拟器,更直观地理解概率、统计、正态分布、大数法则、二项分布等抽象数学概念。
还有经典的 3D 飞行游戏。
不过这游戏场景看起来还不够丰富。
Advanced 用户可以使用 Canvas
刚刚,谷歌官方宣布,Gemini Advanced 用户可以在 Gemini 2.5 Pro 中使用 Canvas 进行创作了。
他们还给出了一个 3D 恐龙世界示例,表示仅用几分钟和几个提示就完成了。
谷歌表示他们正在努力让 Gemini 2.5 Pro 尽快对更多人开放试用。
在 GPT-4o 的声势和吉卜力画风席卷全网之际,谷歌的 Gemini 2.5 Pro 悄然崛起,用一连串硬核的技术实力和实战应用回应了所有质疑。
从 3D 建模到秒解魔方,从高尔顿板到 Minecraft 游戏,无论你是开发者、创作者,还是科技爱好者,现在是时候重新认识 Gemini 了。
别只盯着热度,真正的力量,往往藏在冷静的数据和落地的能力中。
参考资料: