实测免费 DeepResearch!轻量版深夜上线,基于 o4-mini,速度更快 / 重视脉络梳理

终于,免费用户也能用上 OpenAI 的 DeepResearch 了,量子位也进行了新鲜实测!

OpenAI 深夜官宣,基于 o4-mini 某个版本的轻量版 DeepResearch 正式上线。

按照官方说法,轻量版的回答会更短,但智能水平将几乎无异于满血版本。

与此同时,轻量版的上线也意味着付费用户可以有更多的使用次数。

具体来说,付费用户的满血版用量不变,但每月可以获得额外的轻量版使用机会,在满血额度用完后会自动切换。

那么,两个版本表现究竟有何异同,来看量子位实测~

实测轻量版 DeepResearch

我们一共找了 10 个话题让 ChatGPT 进行深度研究,首先一并展示下用时、资料数量等能够直接统计的数据。

整体来看,轻量版的用时和生成内容字数都明显要比满血版更少,至于参考资料数量则没有明显规律。

接下来,我们选择其中三个,仔细对比一下满血版和轻量版形成的报告质量:

印欧语系语言的演变历史

2024 年 AI 穿戴市场发展情况

推理大模型中的关键技术

无论是哪个版本,在我们提出研究话题时,都会询问研究的具体内容、侧重点等信息。

话题 1:印欧语系语言的演变历史

以第一个话题 "印欧语系语言的演变历史" 为例,满血版和轻量版在问题细化方面询问的思路基本一致_(下图中上方为满血版,下方为轻量版)_:

我们回复 "整体梳理,从古至今"。

然后模型便会开始规划检索,关于这个话题,两个版本引用的资料都是主要来自维基百科和大英百科全书,而满血版还多引用了部分中文资源_(仅限于当前话题,其他话题中轻量版也会引用非英语资源)_。

(下图中左侧为满血版,右侧为轻量版)

通过二级标题来看最终报告的结构,满血版采用了总 - 分 - 总的结构,并将印欧语系下属各个语族分别作为一个部分进行了详细介绍。

而轻量版的结构更加注重整体,每一部分都是分别从不同角度在讲述演变的过程。(下图中左侧为满血版,右侧为轻量版)

满血版的报告当中,每一个下属语族的介绍都非常详细。

轻量版则更侧重于展示脉络,将演变的大致过程做了简要介绍,详细程度则比不上满血版本。

话题 2:2024 年 AI 穿戴市场发展情况

前面一个问题主要是让模型在时间维度上进行信息梳理,接下来的这个话题则围绕空间维度进行展开。

问题细化的过程是这样,两个版本区别不大_(图中还是上面满血下面轻量版)_,我们则是直接这些内容全都要。

中间过程就不多赘述,两个版本从结构上依然是大致相似_(左满血右轻量)_。

市场规模的部分,满血版分为了全球、国内和增长趋势三个部分进行介绍,包含了大量具体数据和部分原因简析,之后的增长趋势还根据产品的具体类型进行了细分。

并且还根据 IDC 的数据绘制出了表格:

相比之下,轻量版也覆盖了其中的一部分要点并同样是全球 - 国内 - 趋势这样的结构,但每部分都只用一两句话带过。

至于表格,则是没有的。

不过到了厂商部分,又变成了轻量版_(下图右侧)_的展示更加条理清晰。

后面的内容就不一一拆解了,整体来看,无论是从时间还是空间维度上梳理,满血版都比轻量版多了大量的细节_(下图为满血版)_。

话题 3:推理大模型中的关键技术

第三个话题关于推理大模型中的关键技术,这次两个版本问出的细化问题稍有不同。

我们回复重点关注模型架构、训练算法和推理优化这三部分的信息。

对于模型架构的部分,轻量版(下图右侧)做出了表格整理,而满血版分成了三个段进行文字叙述。

算法部分,轻量版提到了 SFT、RLHF、对比学习与自监督等内容,而满血版则分成了指令微调与多任务训练、链式思维训练与过程监督、反事实训练与自我监督机制这三个部分。

最后关于推理优化,轻量版提及了量化、蒸馏、剪枝、KV 缓存优化等技术,满血版在此之外还提到了自适应推理、并行解码等内容。

总得来看,如果比较详细程度,满血版是当之无愧的获胜者。

但如果只是用来帮助我们确定大概的研究思路和可能涉猎的内容,轻量版,也足以解决一部分需求。

甚至对于不喜欢长篇大论的用户来说,轻量版看上去会更加简洁。

关键是,免费用户也能用啊。

参考链接:
x.com/OpenAI/stat...

欢迎在评论区留下你的想法!

--- ---

相关推荐
张彦峰ZYF1 小时前
走出 Demo,走向现实:DeepSeek-VL 的多模态工程路线图
人工智能
Johny_Zhao1 小时前
Vmware workstation安装部署微软SCCM服务系统
网络·人工智能·python·sql·网络安全·信息安全·微软·云计算·shell·系统运维·sccm
动感光博1 小时前
Unity(URP渲染管线)的后处理、动画制作、虚拟相机(Virtual Camera)
开发语言·人工智能·计算机视觉·unity·c#·游戏引擎
IT古董2 小时前
【漫话机器学习系列】259.神经网络参数的初始化(Initialization Of Neural Network Parameters)
人工智能·神经网络·机器学习
tyatyatya2 小时前
神经网络在MATLAB中是如何实现的?
人工智能·神经网络·matlab
Jackson@ML2 小时前
一分钟了解大语言模型(LLMs)
人工智能·语言模型·自然语言处理
让学习成为一种生活方式2 小时前
大麦(Hordeum vulgare)中 BAHD 超家族酰基转移酶-文献精读129
人工智能
思茂信息2 小时前
CST软件对OPERA&CST软件联合仿真汽车无线充电站对人体的影响
c语言·开发语言·人工智能·matlab·汽车·软件构建
墨绿色的摆渡人2 小时前
pytorch小记(二十):深入解析 PyTorch 的 `torch.randn_like`:原理、参数与实战示例
人工智能·pytorch·python
lqjun08272 小时前
Pytorch实现常用代码笔记
人工智能·pytorch·笔记