突发!谷歌发布Gemini 2.5 Pro正式版,碾压Claude Opus 4,国内直接使用

6 月 18 日,Google 发布 Gemini 2.5 Pro 和 Gemini 2.5 Flash 正式版,并推出了 Gemini 2.5 Flash-Lite 预览版。

向ChatGPT看齐,为用户提供从高性能到高效能的多种选择,满足不同任务需求。

在内卷的AI时代,感觉有些多余,大家都是哪个最强用哪个,经济和速度指标存在感略低。

Gemini 2.5 Pro 性能表现:

  1. 所有2.5系列模型都能处理100万token的内容(相当于几本书的文字量);
  2. 都可以理解文字、图片、视频等多种输入;
  3. 内置Google搜索和代码执行功能;
  4. 具有"思考模式",能够进行更深入的推理。

🏆 性能之王Gemini 2.5 Pro

🚀 编程能力大幅跃升

  • LiveCodeBench: 达到约70%准确率,相比1.5版本提升近2倍
  • Aider Polyglot: 突破80%,成为多语言编程的顶尖选手
  • SWE-bench Verified: 超过65%,在实际软件工程任务中表现卓越

🧠 推理与数学能力突破性进展

  • AIME 2025: 数学竞赛准确率飙升至约88%,展现出接近人类数学竞赛选手的水平
  • HiddenMath-Hard: 在高难度数学问题上达到约82%,证明了其深度推理能力
  • GPQA (diamond): 在研究生级别的科学问题上达到约86%,展现了专业级的知识理解

⚡ 速度之王Gemini 2.5 Flash

350 tokens/秒:Gemini 2.5 Flash 以绝对优势领跑所有模型比前代 Gemini 2.0 Flash 提升约 40%(250→350 tokens/秒),是 Gemini 2.5 Pro 的 2.3倍 。

🚀 碾压式领先

  • 比 OpenAI 最快模型快 94%:o4-mini (high) 仅180 tokens/秒
  • 比 Claude 4 快 7-8倍:Claude系列仅50 tokens/秒左右
  • 比 DeepSeek R1 快 17倍:后者仅20 tokens/秒

💡 关键优势

  • 极致响应速度:几乎实时的交互体验,大幅减少用户等待时间
  • 高效能输出:在保持质量的同时实现了前所未有的生成速度
  • 完美平衡:不仅是Google最快的模型,更是整个行业的速度标杆

Gemini 2.5 Flash 真正定义了什么是"闪电般"的AI体验,为实时对话、批量处理和高并发应用场景开启了全新可能。

这种速度优势使其成为需要快速响应的应用场景的理想选择。

🚀 开源王者Gemini 2.5 Flash-Lite

Gemini 2.5 Flash-Lite 处于预览阶段,是 2.5 系列中最具成本效益和速度最快的模型。

支持 Google 搜索接地、代码执行、URL 上下文和函数调用,"思考"功能默认关闭,但可通过 API 参数动态启用。

特别适合需要低延迟和高效率的场景,如实时翻译和分类任务。

国内直接使用Gemini 2.5 pro

无需魔法、不需要国外邮箱、不需要绑定信用卡、不需要20美元/月。

使用地址:www.nezhasoft.cloud

还包含了ChatGPT4o、o4-mini-high、o3、GPT4.5、GPT4.1、Gemini 2.5 Pro 0605、Claude Sonnet 4、DeepSeek R1 0528、Grok3 thinking等模型。

一句话搞定一个需求

1、写作

全国二卷作文题目:"梦的赠予"

材料内容: "昨夜闲潭梦落花""我欲因之梦吴越""铁马冰河入梦来"......梦往往以一种独特的方式呈现我们的感受和期冀,为我们打开更浩瀚的天空。我们也常常向别人讲述自己的梦,用文字记录自己的梦,以行动实现自己的梦。

如果有一天,我们能够将梦赠予他人......

写作要求: 以上材料引发了你怎样的联想和思考?请写一篇文章。要求选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。

2、官网Demo

通过Three.js创建出3D DNA模型,效果非常逼真。

3、小球弹跳测试

Arena-Hard小球弹跳测试,它用于评估大模型在推理、计算、代码等多个方面的综合能力。

使用 p5.js创建 5 个彩色球在四个旋转的嵌套的分别有一个缺口的六边形内弹跳的效果,旋转速度较快,考虑重力,弹性,摩擦和碰撞,符合物理自然规律。

4、直接"喂食"《Java并发编程实战》.pdf技术书籍

几十万字的学术论文、技术书籍、毕业设计、项目资料都能直接"喂进去",让Gemini 2.5 pro快速总结、归纳、优化、降低论文查重率,写作效率提升数倍。

根据文档内容,围绕"Java 并发编程实战",总结一份学术论文大纲。

5、横向对比四大模型

我们通过Gemini 2.5 Pro 横向对比以下时下最火的四大模型Gemini 2.5 Pro、o3、Claude Opus 4、DeepSeek R1 0528,并画一个柱状图,做一个小总结。

相关推荐
关键帧Keyframe1 天前
【AIGC】ComfyUI 入门教程(1):安装 ComfyUI|AI 生成图片
aigc·openai
胖墩会武术1 天前
OpenAI API调用教程
python·openai·api
新智元1 天前
美 7000 万人或被取代,Agent 光速卷入职场!北大校友、杨笛一新作
人工智能·openai
新智元1 天前
谷歌 Gemini 2.5 全线爆发!勇战「濒死恐慌」,却被丝血宝可梦吓到当场宕机
人工智能·openai
新智元2 天前
亚马逊 CEO 全员信曝光,硅谷 AI 裁员潮已至!年薪 50 万湾区 HR 被算法淘汰
人工智能·openai
机器之心2 天前
刚刚,Gemini 2.5系列模型更新,最新轻量版Flash-Lite竟能实时编写操作系统
人工智能·gemini
奇舞精选3 天前
Prompt 工程实用技巧:掌握高效 AI 交互核心
前端·openai
新智元3 天前
DeepSeek-R1 编程问鼎,媲美 Claude 4!2025 AI 上半场战报来袭
人工智能·openai
新智元3 天前
刚刚,谷歌 AI 路线图曝光:竟要抛弃注意力机制?Transformer 有致命缺陷!
人工智能·openai