o1 满血版泄露!奥数题图片推理手拿把掐,奥特曼上线剧透 o2

o1 满血版泄露了!

没想到,OpenAI 还搁那儿 "今年一定" 呢,不少网友已经率先上手体验到了(doge)。

事情是酱婶的:有网友发现,OpenAI 已经在 ChatGPT 官网上部署了完整版 o1,大家伙儿还都能卡 bug 直接用!

最初发现此事的网友,测试确认泄露模型具有奥特曼所说的图像推理能力

**△**图源:𝕏@legit_rumors

而日志也显示该模型就是 o1 本模。

于是,赶在 OpenAI 出手修复之前,网友们抓紧大玩特玩了一波------

满血 o1 到底有多牛

和已经发布的 o1-preview、o1-mini 最直观的不同是,泄露出来的 o1 支持上传附件。

这也就意味着,终于能测测 o1 的多模态能力了。

网友们也不说废话,直接上强度,普特南数学竞赛的证明题截图一贴,甩给满血 o1。

对正整数 n,有 fn(x)=cos(x)cos(2x)cos(3x)...cos(nx)。找出最小的 n,使得 | fn''(0)|>2023。

思考了 18 秒之后,o1 给出答案:18。

答案正确:

再来一道更复杂的,虽然在识图上遇到了一点小问题,但还是稳稳做对了。


在如此惊艳表现之下,似乎正确识别人类史上首张黑洞照片也不算什么了(doge)。

不过嘛,也不是没有翻车案例。比如,让大模型数数图里有多少个三角形。

ID 为 anagh 的𝕏网友,给泄露模型和 GPT-4o 做了个同屏对比:

视频详情

4o 速度很快,给出了错误答案 19。

而满血 o1 花了 1 分 39 秒,狂刷一堆 token...... 给出了不同的错误答案:29。

正确答案是 24。

这个 bug 现在已经修复了。不过,有意思的是,这次模型泄露,持续了整整 3 个小时。

不小心还是故意的?

有网友犀利地点出,这事儿看上去不是 "不小心",而是 "精心策划":

目的是让人们对即将发布的模型有一个预期。

不少网友赞同这样的观点:

奥特曼的目的是测试和炒作。

而由于一切看上去已经部署就绪,甚至有人猜测,o1 完整版的正式上线时间就在未来一周之内。

值得注意的是,就在这次泄露事件之后,奥特曼马上在𝕏上开始了自己的表演:

好家伙,都已经吹上 o2 的风了(还假装上错号......)。

至于为什么是这个时间......

那不得赶在 Anthropic 发布 Claude Haiku 3.5 之前搞点事嘛(doge)。

参考链接:

1\][x.com/legit_rumor...](https://link.juejin.cn?target=https%3A%2F%2Fx.com%2Flegit_rumors%2Fstatus%2F1852625385801859321 "https://x.com/legit_rumors/status/1852625385801859321") \[2\][x.com/koltregaske...](https://link.juejin.cn?target=https%3A%2F%2Fx.com%2Fkoltregaskes%2Fstatus%2F1852657291469709626 "https://x.com/koltregaskes/status/1852657291469709626") \[3\][x.com/anaghnairr/...](https://link.juejin.cn?target=https%3A%2F%2Fx.com%2Fanaghnairr%2Fstatus%2F1852668741751919016 "https://x.com/anaghnairr/status/1852668741751919016") --- **完** ---

相关推荐
阿坡RPA7 小时前
手搓MCP客户端&服务端:从零到实战极速了解MCP是什么?
人工智能·aigc
用户27784491049937 小时前
借助DeepSeek智能生成测试用例:从提示词到Excel表格的全流程实践
人工智能·python
机器之心7 小时前
刚刚,DeepSeek公布推理时Scaling新论文,R2要来了?
人工智能
算AI9 小时前
人工智能+牙科:临床应用中的几个问题
人工智能·算法
凯子坚持 c10 小时前
基于飞桨框架3.0本地DeepSeek-R1蒸馏版部署实战
人工智能·paddlepaddle
你觉得20510 小时前
哈尔滨工业大学DeepSeek公开课:探索大模型原理、技术与应用从GPT到DeepSeek|附视频与讲义下载方法
大数据·人工智能·python·gpt·学习·机器学习·aigc
8K超高清11 小时前
中国8K摄像机:科技赋能文化传承新图景
大数据·人工智能·科技·物联网·智能硬件
hyshhhh11 小时前
【算法岗面试题】深度学习中如何防止过拟合?
网络·人工智能·深度学习·神经网络·算法·计算机视觉
薛定谔的猫-菜鸟程序员11 小时前
零基础玩转深度神经网络大模型:从Hello World到AI炼金术-详解版(含:Conda 全面使用指南)
人工智能·神经网络·dnn
币之互联万物11 小时前
2025 AI智能数字农业研讨会在苏州启幕,科技助农与数据兴业成焦点
人工智能·科技