Gemini 2.5:谷歌迄今最强"脑力天花板"模型,70 秒生成一个小游戏

大家好,我是拭心。

谷歌在昨天推出新一代人工智能模型 Gemini 2.5 Pro 实验版,体验了一把,的确不错,给大家简单介绍一下。

如上图所示,相较于其他模型(尤其是上图风头正盛的后三个)Gemini 2.5 Pro 在数学、编程、视觉理解、长文本处理和多语言理解等多个方面都表现出色,是一个能力全面、表现优异的人工智能模型。

根据官方数据,其数学与科学推理能力较前代提升超过 20%,在 LMArena 人类偏好评估中更是以断层式优势登顶。

核心突破

  • 类人推理能力:通过增强型基础架构与后训练优化,2.5 Pro 可模拟人类多步思考过程,在无需额外投票机制的情况下,于 GPQA 等专业测试中超越现有主流模型
  • 编程新标杆:SWE-Bench 代理编码评估中取得 63.8% 的突破性成绩,支持从单行指令生成完整网页应用(比如输入"创建太空主题贪吃蛇游戏",即可获得可执行代码)
  • 百万级上下文:支持处理相当于 70 万汉字的长文本,即将扩展至 200 万 token,可同时解析代码库、学术论文与多媒体内容

编程能力

在程序员最关注的编程能力方面,Gemini 2.5 给我的体验是不亚于 Claude 3.7,在我们输入需求后,它可以进一步分析需求细节、设计实现方案并且执行。

如何使用

要使用 Gemini 2.5 有两种方式:

  1. Google AI Studio
  2. gemini.google.com/

打开均需要魔法

案例:开发一个 H5 小游戏

我们跟随官方示例,体验一下使用 Gemini 2.5 开发小游戏。

首先打开 Google AI Studio,选择模型 Gemini 2.5 Pro:

输入 prompt:

Make me a captivating endless runner game. Key instructions on the screen. p5 js scene, no HTML. I like pixelated dinosaurs and interesting backgrounds

对应中文:

为我制作一款引人入胜的无尽跑酷游戏。屏幕上展示关键说明。p5js 场景(一个 H5 预览网站),无 HTML。我喜欢像素化的恐龙和有趣的背景

等待生成代码:

代码生成完成后,复制代码,打开 p5js 的 editor 页面:editor.p5js.org/

粘贴代码,即可预览&体验:

从输入 prompt 到代码完成,70s,效率还是比较高的。

从 thoughts 模块(类似 DeepSeek 的思考)来看,Gemini 2.5 为了生成这个游戏做了这些事:

  1. 理解核心需求
  2. 设计游戏机制
  3. 确定视觉风格
  4. 理解 p5js 需要的代码网站结构
  5. 设计实现计划
  6. 详细实现

基本上和人类程序员理解需求到设计开发一致。

整体来说,Gemini 2.5 给个人的感觉还是很惊艳的,这下 Claude 3.7 无响应时有备胎了!

相关推荐
JustHappy7 小时前
古法编程秘籍(七):互联网到底是什么?把两台电脑怎么说话搞懂就够了
前端·后端·网络协议
snow@li7 小时前
SEO-文章标题:写文章时候,分类+主标题+大纲+解释 作为标题 / 不点进去也知道全文覆盖什么 / 标题即架构
前端
kyriewen8 小时前
Git Commit 前自动修复代码风格?配置 Husky + lint-staged,从此 CR 只聊逻辑
前端·git·面试
小和尚同志8 小时前
AI 自动化测试探索(一):Playwright MCP
前端·人工智能·aigc
老马识途2.08 小时前
在AI的帮助下理解spring的启动过程
java·前端·spring
徐小夕9 小时前
Loop Engineering 深度解析与实战指南(全网最全)
前端·算法·github
运筹vivo@9 小时前
Python ContextVar 底层机制与内存模型拆解
前端·数据库·python
#麻辣小龙虾#10 小时前
基于vue3.0开发一款【固废与废气运维管理系统】(支持源码)
前端·vue.js·vue3
Cosolar11 小时前
Docsify零构建文档站完全指南:从快速搭建到企业级部署
前端·开源·github
weixin_4713830311 小时前
Taro-02-页面路由
前端·taro