刚刚,谷歌发布了Gemini 3.1 Pro,同时Google AI Studio也已经支持全栈应用开发。

Shadow:刚刚,谷歌发布了Gemini 3.1 Pro 模型,多项指标再次领先,非常适合用于开发算法、复杂编程以及需要多步工作流执行的Agent场景。在机器学习研发挑战中,该模型将微调脚本的耗时从 300 秒极限压缩至 47 秒 ------ 不仅宣告了'手动调优'时代的落幕,甚至比顶尖人类专家(94 秒)还快了一倍。

以下为详细介绍:

1. Gemini 3.1 Pro

Gemini 3.1 Pro 是 Google Gemini 3 系列模型的最新迭代版本,是目前 Google 处理复杂任务最先进的原生多模态推理模型。它不仅能理解文本、音频、图像和视频,还能深度解析整个代码库,专为解决现实世界的复杂问题、强化逻辑推理、激发创造力以及进行战略规划而设计。

2. 在哪里可以使用?

Gemini 3.1 Pro 通过以下多种渠道分发,用户无需特定硬件即可使用:

  • Gemini App:面向普通用户的交互界面。
  • Google AI Studio & Gemini API:面向开发者进行快速开发和原型设计。
  • Google Cloud / Vertex AI:提供企业级的托管服务。
  • NotebookLM:用于深度学习和文档分析。
  • Google Antigravity:特定的分发渠道之一。

我第一时间在Google AI Studio测试了下:制作一个记忆操作系统。

在生成过程提示可能的操作:Enjoy these tips while you wait

思考时间明显比Gemini 3 Pro更长。

注意一个细节,开始支持全栈应用的开发了,我看到框架已经使用express。

如果你想尝试vibe coding更多的应用,可以查阅最新书籍:

(私信加入读者群)

3. 性能提升(对比 Gemini 3 Pro)

根据谷歌的介绍 Gemini 3.1 Pro 在多个核心维度上较前代 Gemini 3 Pro 有了质的飞跃:

  • 抽象推理能力的跨越式增长 :在 ARC-AGI-2 (抽象推理拼图)测试中,得分从 31.1% 飙升至 77.1% ,展示了极强的逻辑推演能力。
  • 代理执行与搜索能力(Agentic Performance)
    • BrowseComp

      (代理搜索任务)得分从 59.2% 提升至 85.9%

    • APEX-Agents

      (长程专业任务)得分从 18.4% 几乎翻倍至 33.5%

    • MCP Atlas

      (多步工作流)从 54.1% 提升至 69.2%

  • 编程与学术推理
    • LiveCodeBench Pro

      (竞赛编程)Elo 分数从 2439 提升至 2887

    • Humanity's Last Exam

      (学术推理)在无工具模式下从 37.5% 提升至 44.4%

  • 长文本与多模态理解
    • MRCR v2

      (长上下文性能)在 128k 平均值上从 77.0% 优化至 84.9%

    • 模型支持高达 100 万(1M)token 的超大输入上下文窗口。

  • 安全性与情境意识 :在"深思模式"(Deep Think mode)下,模型表现出更强的情境意识,在某些挑战(如 Context size mod)中达到了近 100% 的成功率。

欢迎加入社群交流

讲座:Gemini黑客松4000+灵感拆解

更多:storage.googleapis.com/deepmind-media/Model-Cards/Gemini-3-1-Pro-Model-Card.pdf

相关推荐
AIGS0019 分钟前
探索向量空间JBoltAI:工业企业数智化升级的基础设施
java·人工智能·人工智能ai大模型应用
qq_5278878710 分钟前
机器学习训练中Epoch、Batch、Bath_size、Data_size的区别
人工智能·机器学习·batch
林间码客11 分钟前
《人工智能概论》实验6 知识点复习提纲
人工智能
林间码客15 分钟前
《人工智能概论》实验3 知识点复习提纲
人工智能
科技圈快迅16 分钟前
商业旅拍后期修图软件实测:像素蛋糕功能与应用分析
人工智能
无忧智库28 分钟前
某矿山井下人员精准定位与AI行为安全识别管控系统建设方案(WORD)
人工智能·安全
湘美书院--湘美谈教育33 分钟前
湘美谈教育AI经验集锦:有些东西,它们很难蒸馏
大数据·人工智能·深度学习·机器学习
HyperAI超神经36 分钟前
深度估计准确率冲上0.9,Meta提出VLM³,论证视觉模型天生会学3D,以Qwen3-VL-4B为基础实现多任务的统一建模
人工智能·3d·大模型·多模态·空间推理·3d感知·3d理解
Hello:CodeWorld37 分钟前
Dify 从入门到实战:部署、模型对接与企业级 AI 应用开发全教程
人工智能·python·架构·ai编程
AllData公司负责人43 分钟前
大模型赋能AllData数据中台,系列升级|通过联合智谱大模型与Chat2DB开源项目,建设Text2SQL生产场景全新体验的数据源平台!
数据库·人工智能·text2sql·数据中台·数据源·chat2db·智谱大模型