Gemini 2.5:谷歌迄今最强"脑力天花板"模型,70 秒生成一个小游戏

大家好,我是拭心。

谷歌在昨天推出新一代人工智能模型 Gemini 2.5 Pro 实验版,体验了一把,的确不错,给大家简单介绍一下。

如上图所示,相较于其他模型(尤其是上图风头正盛的后三个)Gemini 2.5 Pro 在数学、编程、视觉理解、长文本处理和多语言理解等多个方面都表现出色,是一个能力全面、表现优异的人工智能模型。

根据官方数据,其数学与科学推理能力较前代提升超过 20%,在 LMArena 人类偏好评估中更是以断层式优势登顶。

核心突破

  • 类人推理能力:通过增强型基础架构与后训练优化,2.5 Pro 可模拟人类多步思考过程,在无需额外投票机制的情况下,于 GPQA 等专业测试中超越现有主流模型
  • 编程新标杆:SWE-Bench 代理编码评估中取得 63.8% 的突破性成绩,支持从单行指令生成完整网页应用(比如输入"创建太空主题贪吃蛇游戏",即可获得可执行代码)
  • 百万级上下文:支持处理相当于 70 万汉字的长文本,即将扩展至 200 万 token,可同时解析代码库、学术论文与多媒体内容

编程能力

在程序员最关注的编程能力方面,Gemini 2.5 给我的体验是不亚于 Claude 3.7,在我们输入需求后,它可以进一步分析需求细节、设计实现方案并且执行。

如何使用

要使用 Gemini 2.5 有两种方式:

  1. Google AI Studio
  2. gemini.google.com/

打开均需要魔法

案例:开发一个 H5 小游戏

我们跟随官方示例,体验一下使用 Gemini 2.5 开发小游戏。

首先打开 Google AI Studio,选择模型 Gemini 2.5 Pro:

输入 prompt:

Make me a captivating endless runner game. Key instructions on the screen. p5 js scene, no HTML. I like pixelated dinosaurs and interesting backgrounds

对应中文:

为我制作一款引人入胜的无尽跑酷游戏。屏幕上展示关键说明。p5js 场景(一个 H5 预览网站),无 HTML。我喜欢像素化的恐龙和有趣的背景

等待生成代码:

代码生成完成后,复制代码,打开 p5js 的 editor 页面:editor.p5js.org/

粘贴代码,即可预览&体验:

从输入 prompt 到代码完成,70s,效率还是比较高的。

从 thoughts 模块(类似 DeepSeek 的思考)来看,Gemini 2.5 为了生成这个游戏做了这些事:

  1. 理解核心需求
  2. 设计游戏机制
  3. 确定视觉风格
  4. 理解 p5js 需要的代码网站结构
  5. 设计实现计划
  6. 详细实现

基本上和人类程序员理解需求到设计开发一致。

整体来说,Gemini 2.5 给个人的感觉还是很惊艳的,这下 Claude 3.7 无响应时有备胎了!

相关推荐
Senar5 小时前
如何判断浏览器是否开启硬件加速
前端·javascript·数据可视化
HtwHUAT5 小时前
实验四 Java图形界面与事件处理
开发语言·前端·python
利刃之灵5 小时前
01-初识前端
前端
codingandsleeping5 小时前
一个简易版无缝轮播图的实现思路
前端·javascript·css
天天扭码5 小时前
一分钟解决 | 高频面试算法题——最大子数组之和
前端·算法·面试
全宝6 小时前
🌏【cesium系列】01.vue3+vite集成Cesium
前端·gis·cesium
拉不动的猪6 小时前
简单回顾下插槽透传
前端·javascript·面试
烛阴6 小时前
Fragment Shader--一行代码让屏幕瞬间变黄
前端·webgl
爱吃鱼的锅包肉7 小时前
Flutter路由模块化管理方案
前端·javascript·flutter
风清扬雨7 小时前
Vue3具名插槽用法全解——从零到一的详细指南
前端·javascript·vue.js