开创先河!o3和o4-mini居然能在思维链思考图片,太逆天了!

凌晨1点,OpenAI的重头戏来了!

终于是把之前鸽了很久的满血版o3发布出来了,还有一个新的模型o4-mini。

先说一个最让我感觉牛*的功能,o3和o4-mini居然能进行视觉推理了。

可能大家一时还不太理解,给大家看几个例子。

博主@数字生命卡兹克让o3看图猜地理位置,虽然这道题平平无奇,但你如果看到它的推理过程,绝对直呼牛逼。

扔给o3一张图片,让它猜这是哪里?

大家请看它的推理过程,就非常离谱,它居然在思维量里面带图片了。

它一点一点到放大图片,如何进行思考,如果思考方向不对,果断换方向思考。

之前的模型在思考的时候,通常都是文字,而且一大堆,阅读难度高,而现在大模型居然能把照片真正的融入到推理中(又是一项创新)。

再来揭晓一下答案,它给出的答案是北京市西部109国道妙峰山-斋堂-雁翅。

o3给出的回答正确,再来看一下它的推理过程,它居然是通过植被、地脉、道路、环境氛围等因素推断这里是妙峰山附近,就真的很离谱。

再来看另外一个例子,虽然是英文,但是整体很好理解,让o3解决桌子的那道题,它首先会去定位问题,然后一步一步把图片放大,直到把纸上的例题可以看清,最后给出经过推理给出答案。

此次OpenAI的o3和o4-mini的视觉推理给我冲击最大,这也意味着大模型开始真正的理解3D世界了,而不再是停留在文字上,此前关于OpenAI回答不出的空间问题,现在终于能解决了。

视觉思考也开始让模型可以像人类一样从图表、图形,甚至是对图像中提取信息、进行深度推理并解决问题。

除了视觉推理外,还有几个不错的亮点,o3开始可以使用工具了。

终于不像o1那样无法联网、不能使用代码解释器,当推理能力更强的o3再结合上OpenAI的这些工具,o3的能力将会再次拔高。

还有一个亮点就是o3和o4-mini性价比更高,在定价上,o3比o1的定价便宜了三分之一,o4-mini相比o3-mini没涨价。

大家在调用的时候该选谁,应该都清楚了吧,可以果断弃用o1了,毕竟o3好用还便宜。

老规矩,再给大家看一下o3的跑分成绩。

在Codeforces编程竞赛评分中,o3和o4-mini得分均超过了2700分,效果远超o1和o3-mini。

如果o3和o4-mini调用工具,它们的能力会进一步增强。

在OpenAI放出的专家综合考题中,显示不带插件的o3准确率约为20.3%,添上Python、网络浏览甚至调用多种工具后能推到24.9%。

相比之下,不带插件的o4-mini为14.3%,但借助插件也仅为17.7%,远不及o3。

这些纸面的成绩就不过多展示了,大家在其他博主也都可以看到。

最后,给大家看一些o3、o4-mini的实际表现。

目前,GPT-4o、o3、o4-mini都支持最新的生图功能,你只需要明确告诉ChatGPT你需要生成图片就行。比如在对话时,前缀加上 "请生成图片"。

让Gemini-2.5-Pro、o3、o4-mini与DeepSeek-R1进行测试碰撞球的物理效果。

已关注

**

关注

**重播 **分享 **赞

关闭**

观看更多

更多**

**

**

**

退出全屏

**

切换到竖屏全屏 退出全屏

AI工具导航站已关注

**

分享视频

**,时长00:07

0/0

00:00/00:07

切换到横屏模式

继续播放

进度条,百分之0

**

播放

00:00

/

00:07

00:07

全屏

**倍速播放中

0.5倍0.75倍1.0倍1.5倍2.0倍

超清流畅

您的浏览器不支持 video 标签

**

继续观看

开创先河!o3和o4-mini居然能在思维链思考图片,太逆天了!

观看更多**

转载

,

开创先河!o3和o4-mini居然能在思维链思考图片,太逆天了!

**

AI工具导航站已关注

分享点赞在看

****已同步到看一看写下你的评论

**

视频详情

o3的表现确实不错,但博主@牙医在经过测试完说:OpenAI o4-mini的编程能力不如Gemini-2.5 ,只排在第七位。

效果到底如何,还是得自己上手才知道,也欢迎大家在评论区发表一下自己的使用心得。

目前o3、o4-mini 和 o4-mini-high 已经推送到 ChatGPT。 Plus、Pro 和 Team 用户已可用,大家有会员的可以去体验一下。

如果大家还不知道如何订阅ChatGPT,可以看之前的文章。

相关阅读:国内用户如何订阅ChatGPT。

除了发布新模型外,OpenAI 这次还开源了一个新工具"Codex CLI"。

一个可以直接在终端(terminal)运行的轻量级AI编程助手,支持调用 o3 和 o4-mini 等模型。

目前该开源项目,已经斩获10000多颗小星星了。

开源地址: github.com/openai/code...

好了,今天的分享就到这里,欢迎大家来评论区激烈讨论!

相关推荐
realhuizhu2 天前
国庆收心指南:用AI提示词工程解决节后综合征
人工智能·ai·chatgpt·prompt·提示词·deepseek·假期综合征·节后综合征
yueyuebaobaoxinx2 天前
人机共生:生成式 AI 重构内容创作的机遇与博弈
人工智能·chatgpt·重构
张较瘦_2 天前
[论文阅读] AI+教学 | 编程入门课的AI助手革命?ChatGPT的4大核心影响全解析
论文阅读·人工智能·chatgpt
文火冰糖的硅基工坊5 天前
[创业之路-666]:第四次工业革命(智能革命)未来将创造大量的财富,普通人通过哪些方式参与这些财富的创造与分享?
人工智能·chatgpt·系统架构·产品运营·产业链
低调小一5 天前
iPhone美区账号登录指南:轻松下载ChatGPT应用
ios·chatgpt·iphone
媒体人8885 天前
中国顶级 GEO 优化专家孟庆涛:用 15 年积淀定义 2025 年 GEO 优化新标准
人工智能·搜索引擎·chatgpt·生成式引擎优化·geo优化
学境思源AcademicIdeas7 天前
用ChatGPT修改论文,如何在提升质量的同时降低AI检测风险?
人工智能·chatgpt
骑猪兜风2338 天前
深度解析 ChatGPT 和 Claude 的记忆机制
人工智能·chatgpt·ai编程
就不爱吃大米饭8 天前
ChatGPT被降智怎么办?自查方法+恢复指南
网络·人工智能·chatgpt
ASKED_20199 天前
ChatGPT From Zero To Hero - LLM学习笔记(一)
笔记·学习·chatgpt