Gemini 2.5：谷歌迄今最强"脑力天花板"模型，70 秒生成一个小游戏

大家好，我是拭心。

谷歌在昨天推出新一代人工智能模型 Gemini 2.5 Pro 实验版，体验了一把，的确不错，给大家简单介绍一下。

如上图所示，相较于其他模型（尤其是上图风头正盛的后三个）Gemini 2.5 Pro 在数学、编程、视觉理解、长文本处理和多语言理解等多个方面都表现出色，是一个能力全面、表现优异的人工智能模型。

根据官方数据，其数学与科学推理能力较前代提升超过 20%，在 LMArena 人类偏好评估中更是以断层式优势登顶。

核心突破

类人推理能力：通过增强型基础架构与后训练优化，2.5 Pro 可模拟人类多步思考过程，在无需额外投票机制的情况下，于 GPQA 等专业测试中超越现有主流模型
编程新标杆：SWE-Bench 代理编码评估中取得 63.8% 的突破性成绩，支持从单行指令生成完整网页应用（比如输入"创建太空主题贪吃蛇游戏"，即可获得可执行代码）
百万级上下文：支持处理相当于 70 万汉字的长文本，即将扩展至 200 万 token，可同时解析代码库、学术论文与多媒体内容

编程能力

在程序员最关注的编程能力方面，Gemini 2.5 给我的体验是不亚于 Claude 3.7，在我们输入需求后，它可以进一步分析需求细节、设计实现方案并且执行。

如何使用

要使用 Gemini 2.5 有两种方式：

打开均需要魔法

案例：开发一个 H5 小游戏

我们跟随官方示例，体验一下使用 Gemini 2.5 开发小游戏。

首先打开 Google AI Studio，选择模型 Gemini 2.5 Pro:

输入 prompt:

Make me a captivating endless runner game. Key instructions on the screen. p5 js scene, no HTML. I like pixelated dinosaurs and interesting backgrounds

对应中文：

为我制作一款引人入胜的无尽跑酷游戏。屏幕上展示关键说明。p5js 场景（一个 H5 预览网站），无 HTML。我喜欢像素化的恐龙和有趣的背景

等待生成代码：

代码生成完成后，复制代码，打开 p5js 的 editor 页面：editor.p5js.org/

粘贴代码，即可预览&体验：

从输入 prompt 到代码完成，70s，效率还是比较高的。

从 thoughts 模块（类似 DeepSeek 的思考）来看，Gemini 2.5 为了生成这个游戏做了这些事：

理解核心需求
设计游戏机制
确定视觉风格
理解 p5js 需要的代码网站结构
设计实现计划
详细实现

基本上和人类程序员理解需求到设计开发一致。