谷歌深夜炸场:月费250刀的Deep Think,这次真的学会了“慢思考”

2025年的AI圈,大家都卷累了。

就在我们以为今年的大模型之战会以平淡收场时,谷歌在12月5日突然抛出了一枚重磅炸弹:Gemini 3 Deep Think模式正式公测。

这不是一次普通的版本迭代。如果说之前的AI是在拼谁说话更快、谁的嘴皮子更利索,那么这一次,谷歌把赛道直接拉升到了"脑力"维度。那个曾经只会根据概率预测下一个单词的聊天机器人,现在学会了像人类专家一样,在此刻停顿下来,深吸一口气,开始推演。

从"脱口而出"到"深思熟虑"

一直以来,大模型都有个通病:太快了。

你问一个复杂的问题,它恨不得在0.5秒内把答案甩在你脸上。这种"直觉式"的反应(心理学上称为系统1思维),在写写邮件、查查资料时很好用,但一旦遇到复杂的数学证明或严密的逻辑陷阱,AI就会一本正经地胡说八道。

Gemini 3 Deep Think的核心变革,在于它引入了"并行推理"技术。

想象一下,当你面对一道奥数压轴题时,你不会只沿着一条路走到黑。你会先在草稿纸上画出三种解题思路,第一种走不通划掉,第二种好像有漏洞,第三种推导到一半发现是正解,然后才把最终答案写在卷子上。

Deep Think就在做这件事。它不再依赖单一的线性预测,而是同时模拟多条推理路径,在内部进行自我辩驳、验证和筛选。这种"慢思考"(系统2思维),让它在处理那些需要极长逻辑链条的问题时,表现出了惊人的稳定性。

一张昂贵的"奥数金牌"入场券

为了证明这种思考能力不是吹出来的,谷歌直接甩出了硬核成绩单。

在模拟国际数学奥林匹克(IMO)的测试中,Deep Think的变体在无网络、限时、需给出自然语言证明的严苛条件下,拿到了金牌级的分数。在专业科学知识测试GPQA Diamond中,它的准确率飙升到了93.8%,这基本意味着它在科学理解上已经达到了博士水平。

甚至在那个号称"人类最后考卷"的Humanity's Last Exam测试里,在不借助任何外部工具的情况下,它硬是啃下了41.0%的分数。这个数字看着不高,但在这个变态难度的基准线上,它已经把前代模型甩开了几个身位。

当然,想用上这种级别的"外脑",代价不菲。

谷歌明确了它的定位:这不是给普通用户拿来闲聊的玩具。Deep Think目前仅向Gemini Ultra订阅用户开放,月费高达249.99美元。这个定价本身就是一道门槛,它瞄准的是那些真正需要深度分析能力的科研人员、高级程序员和金融分析师。对于他们来说,如果AI能解决一个卡了两周的代码Bug,或者推导出一个新的分子结构,这250美元简直便宜得像白送。

截胡OpenAI,谷歌的阳谋

这次发布的时机也很有意思。

行业里一直有传言,OpenAI手里的GPT-5系列早就在内部跑通了类似的推理能力,但迟迟没有向公众开放。谷歌选在12月初发布Deep Think,被媒体普遍解读为一次精准的"截胡"。

这不仅仅是抢占市场先机,更是在定义下一代AI的标准。谷歌在告诉所有人:未来的顶级AI,不再是看谁的参数量更大,而是看谁能真正解决那些人类都感到棘手的逻辑难题。

对于整个科技界来说,Gemini 3 Deep Think的出现是一个信号。它标志着大模型正在从"生成式内容工具"向"逻辑推理引擎"进化。

虽然目前的高昂定价让它注定只能是少数人的利器,但技术的下放只是时间问题。或许在不久的将来,这种深思熟虑的能力会成为所有AI的标配。但至少在这个12月,谷歌用实力证明了,让AI学会"慢下来",才是真正的快。

如果你也对最新的AI信息感兴趣或者有疑问 都可以加入我的大家庭 第一时间分享最新AI资讯、工具、教程、文档 欢迎你的加入!!!😉😉😉

公众号:墨风如雪小站

相关推荐
狼爷2 小时前
AI时代顶级思维:你的提问方式,早已暴露你的认知层级
aigc·openai
穿过生命散发芬芳7 小时前
OpenClaw:开启OpenCloudOS 操作系统智能运维初体验
人工智能·aigc
树獭叔叔7 小时前
08-大模型后训练的指令微调SFT:LoRA让大模型微调成本降低99%
后端·aigc·openai
小碗细面1 天前
告别手动喂饭!Skill-Seekers 快速构建你的 AI 专属知识库
aigc·ai编程
王小酱1 天前
AI 编程实战指南:核心概念梳理与 Claude Code 高效技巧
aigc·openai·ai编程
是一碗螺丝粉1 天前
LangChain 核心组件深度解析:模型与提示词模板
前端·langchain·aigc
用户5191495848451 天前
Cisco SMA 暴露面检测工具 - 快速识别CVE-2025-20393风险
人工智能·aigc
用户47949283569152 天前
[开源分享] Agent 指挥 Agent,我做了一个让 Claude Code / Codex / Gemini/... 组成"军团"并行干活的工具
aigc·openai·claude
倔强的石头_2 天前
Ring-2.5-1T 万亿思考模型 + Tbox:当深度推理遇上知识沉淀,我的生产力发生了什么质变?
aigc
用户5191495848452 天前
Adrenaline GPU 漏洞利用框架:突破 Android 内核内存读写限制
人工智能·aigc