就在今天,谷歌再度祭出大招,终于把Deep Research的底层模型更换成Gemini 2.5 Pro。 新版本的Deep Research功能效果得到显著的提高。
在Google放出的成绩单来看到,新版的Deep Reseach在在指令遵循、全面性、完整性、写作质量方面切全面超越了OpenAI 的Deep Reseach功能,而且几乎是碾压级的。

为了宣传此次Deep Reseach史诗级的升级,Google CEO甚至亲自下场为它打Call,重视程度可见一斑。

但, 实际效果到底如何 ?
下面我们来实际测试一下。
提示词:帮我获取关于腾讯今年三月份一个月的股票价格详情,我需要每天的数据,并分析其涨幅情况

它直接把腾讯的三月份每天的股票信息制作成表格整理了出来,而且我去对照了一下腾讯三月份的股票涨幅的情况,一模一样。
并且最后它还分析了腾讯涨幅的原因,从我个人的角度来看,我对这份报告是十分满意的。

最后我为了测试一下新版Deep Research的的极限,让它帮我整理一份NBA球队的报告,报告包括每支球队的人员数量,人员姓名,每位队员的薪资待遇,最后帮我预测那支球队今年可以获取NBA总冠军。
结果还真让我测到了,它给出了15支球队人员的详细信息,还有15支球队,它直接摆烂,并没有生成出来。


总共是生成了42页报告,引用了126个链接,生成了20820个字,似乎2万字就是它的极限了,这里吐槽一下,它生成的速度不是很快,这份报告生成了接近20分钟。
目前距离发布已经过了10个小时了,不少网友已经纷纷发布了自己的实际测试。
博主@kol Tregaskes使用 Gemini 2.5 Pro的深度思考功能生成了一篇46页的报告,表示长度比2.0版本的要长得多,与OpenAI 的深度思考功能相当。

而且需要注意的是,它在输出报告的过程中,引用了138个链接,实话实说,Google的生态能力确实强。 还有AI研究科学家ChrisUniverse也是第一时间对Gemini 2.5 Pro的Deep Research做了测试,他让谷歌Deep Reseach研究过去五年纳米技术的突破。
最后输出一份长达46页的学论文,报告引用了339个网站,ChrisUniverse体验过后,直接被震撼住了。


为什么此次新版的Deep Reseach表现如此劲爆了,那这不得不提它最新的底座模型------Gemini 2.5 Pro。 从放出的榜单成绩来看,Gemini 2.5 Pro可以说是有史以来最强的大模型,在大模型竞技场 Chatbot Arena 的榜单上,Gemini 2.5 Pro 以绝对优势强势登顶,创下了前所未有的最大分数飞跃,比 Grok - 3 和 GPT - 4.5 高接近 40 分。

其次,在衡量编码能力的SWE-bench榜单以及衡量模型代码编辑水平的Aider Polyglot榜单中。除了在 Agentic coding 方面逊色于 Claude 3.7 Sonnet,Gemini 2.5 Pro 均斩获第一。

如果大家使用过Gemini 2.5写代码可能会有比较深的感觉,除了在审美能力上不如Claude 3.7外,Gemini 2.5 Pro的编程能力已经可以和Claude 3.7打擂台了。
目前新版的GenimiDeep Reseach已经面向 Gemini Advanced订阅用户开放,仅需19.99美元,要比OpenAI DR(200美元/月)整整便宜10倍。
同时首次订阅Gemini Advanced的用户,首月还能免费白嫖,只需将一张海外支付卡片绑定到Genimi平台就行。 如果你没有海外支付卡片,可以去野卡这个平台搞定,整体还是非常简单的。 野卡官网链接:yeka.ai/i/AGENT