刚刚,谷歌发布了Gemini 3.1 Pro,同时Google AI Studio也已经支持全栈应用开发。

Shadow:刚刚,谷歌发布了Gemini 3.1 Pro 模型,多项指标再次领先,非常适合用于开发算法、复杂编程以及需要多步工作流执行的Agent场景。在机器学习研发挑战中,该模型将微调脚本的耗时从 300 秒极限压缩至 47 秒 ------ 不仅宣告了'手动调优'时代的落幕,甚至比顶尖人类专家(94 秒)还快了一倍。

以下为详细介绍:

1. Gemini 3.1 Pro

Gemini 3.1 Pro 是 Google Gemini 3 系列模型的最新迭代版本,是目前 Google 处理复杂任务最先进的原生多模态推理模型。它不仅能理解文本、音频、图像和视频,还能深度解析整个代码库,专为解决现实世界的复杂问题、强化逻辑推理、激发创造力以及进行战略规划而设计。

2. 在哪里可以使用?

Gemini 3.1 Pro 通过以下多种渠道分发,用户无需特定硬件即可使用:

  • Gemini App:面向普通用户的交互界面。
  • Google AI Studio & Gemini API:面向开发者进行快速开发和原型设计。
  • Google Cloud / Vertex AI:提供企业级的托管服务。
  • NotebookLM:用于深度学习和文档分析。
  • Google Antigravity:特定的分发渠道之一。

我第一时间在Google AI Studio测试了下:制作一个记忆操作系统。

在生成过程提示可能的操作:Enjoy these tips while you wait

思考时间明显比Gemini 3 Pro更长。

注意一个细节,开始支持全栈应用的开发了,我看到框架已经使用express。

如果你想尝试vibe coding更多的应用,可以查阅最新书籍:

(私信加入读者群)

3. 性能提升(对比 Gemini 3 Pro)

根据谷歌的介绍 Gemini 3.1 Pro 在多个核心维度上较前代 Gemini 3 Pro 有了质的飞跃:

  • 抽象推理能力的跨越式增长 :在 ARC-AGI-2 (抽象推理拼图)测试中,得分从 31.1% 飙升至 77.1% ,展示了极强的逻辑推演能力。
  • 代理执行与搜索能力(Agentic Performance)
    • BrowseComp

      (代理搜索任务)得分从 59.2% 提升至 85.9%

    • APEX-Agents

      (长程专业任务)得分从 18.4% 几乎翻倍至 33.5%

    • MCP Atlas

      (多步工作流)从 54.1% 提升至 69.2%

  • 编程与学术推理
    • LiveCodeBench Pro

      (竞赛编程)Elo 分数从 2439 提升至 2887

    • Humanity's Last Exam

      (学术推理)在无工具模式下从 37.5% 提升至 44.4%

  • 长文本与多模态理解
    • MRCR v2

      (长上下文性能)在 128k 平均值上从 77.0% 优化至 84.9%

    • 模型支持高达 100 万(1M)token 的超大输入上下文窗口。

  • 安全性与情境意识 :在"深思模式"(Deep Think mode)下,模型表现出更强的情境意识,在某些挑战(如 Context size mod)中达到了近 100% 的成功率。

欢迎加入社群交流

讲座:Gemini黑客松4000+灵感拆解

更多:storage.googleapis.com/deepmind-media/Model-Cards/Gemini-3-1-Pro-Model-Card.pdf

相关推荐
lijianhua_97128 小时前
国内某顶级大学内部用的ai自动生成论文的提示词
人工智能
蔡俊锋8 小时前
用AI实现乐高式大型可插拔系统的技术方案
人工智能·ai工程·ai原子能力·ai乐高工程
自然语9 小时前
人工智能之数字生命 认知架构白皮书 第7章
人工智能·架构
大熊背9 小时前
利用ISP离线模式进行分块LSC校正的方法
人工智能·算法·机器学习
eastyuxiao9 小时前
如何在不同的机器上运行多个OpenClaw实例?
人工智能·git·架构·github·php
诸葛务农9 小时前
AGI 主要技术路径及核心技术:归一融合及未来之路5
大数据·人工智能
光影少年9 小时前
AI Agent智能体开发
人工智能·aigc·ai编程
ai生成式引擎优化技术9 小时前
TSPR-WEB-LLM-HIC (TWLH四元结构)AI生成式引擎(GEO)技术白皮书
人工智能
帐篷Li9 小时前
9Router:开源AI路由网关的架构设计与技术实现深度解析
人工智能
新缸中之脑10 小时前
在GCP上运行autoresearch
人工智能