免费!OpenAI发布最新模型GPT-4o mini,取代GPT-3.5,GPT-3.5退出历史舞台?

有个小伙伴问我,GPT-4O mini是什么,当时我还一脸懵逼,便做了一波猜测:

我猜测哈,这个可能是ChatGPT4o的前提下,只支持文本功能的版本,速度更快

结果,大错特错。

让我们一起看看OpenAI官博是怎么说的。

GPT-4o mini比GPT-3.5 Turbo更智能、更便宜。

GPT-4o mini is more than 60% cheaper than GPT-3.5 Turbo

可以这么说, ChatGPT 正式迈入了"4.0"时代。

GPT-4o mini 性价比高!3.5可以光荣退役了。。。

GPT4o mimi升级了哪些内容?

接下来将从GPT3.5 turbo、GPT4o、GPT4o mini三个模型上下对比看下

1、上下文长度
上下文长度 输出长度
GPT3.5 turbo 16K 4K
GPT4o mini 128K 16K
GPT4o 128K 4K

GPT4o mini居然在输出长度方面,超过了20美元/月的GPT4o。

2、多模态支持

GPT4o mini相较于GPT3.5 turbo只支持文本输入的基础上,又增加了图片输入,也就意味着使用GPT4o可以进行读图了

官方透露,后续会加上视频等输入方式。

3、模型质量

从返回质量上来看,GPT4o mini还是远远甩开GPT3.5 turbo几条街的。

看下官方公布的评估基准水平

4、知识截止时间

GPT4o mini模型的训练知识截止时间几乎做到了和GPT4o同样的时间

模型 知识截止时间
GPT3.5 & GPT3.5 turbo 2021年9月
GPT4.0 & GPT 4o 2023年12月
GPT4o mini 2023年10月

但,知识截止时间影响不大,因为GPT4o早已具备联网查询功能。

5、响应速度

之前速度最快的模型一直是GPT3.5,随着后来的GPT4o推出成为了最快

但是目前第三方测试来看,GPT4o相应速度是目前最快的,也许和模型较小有关系。

接下来 GPT-4 全系列包括:

  • GPT-4o:更适合复杂任务
  • GPT-4o mini:更快完成日常任务
  • GPT-4:传统模式

👉 GPT功能:

  1. GPT-4o知识问答:支持1000+token上下文记忆功能
  2. 最强代码大模型Code Copilot:代码自动补全、代码优化建议、代码重构等
  3. DALL-E AI绘画:AI绘画 + 剪辑 = 自媒体新时代
  4. 私信哪吒,直接使用GPT-4o

7月18日,OpenAI宣布推出GPT-4o mini,一个极具成本效益的小型模型。

OpenAI把GPT-4o mini描述为,一个具有卓越文本智能和多模态推理能力的小模型。

据OpenAI介绍,GPT-4o mini在MMLU上的得分为82%,目前在LMSYS排行榜上的聊天偏好方面优于GPT-4。

GPT-4o mini在文本智能和多模态推理方面的学术基准测试中超越了GPT-3.5 Turbo和其他小型模型,并且支持的语言范围与GPT-4o相同。

GPT-4o mini在函数调用方面也表现出色,可以使开发人员构建获取数据或使用外部系统采取行动的应用程序。

此外,与GPT-3.5 Turbo相比,GPT-4o mini的长上下文性能有所提高。GPT-4o mini已经在几个关键基准上进行了评估。

推理任务:GPT-4o mini在涉及文本和视觉的推理任务上优于其他小型模型,在文本智能和推理基准MMLU上的得分为82.0%,而Gemini Flash为77.9%,Claude Haiku为73.8%。

数学和编码能力:GPT-4o mini在数学推理和编码任务中的表现优于市场上之前的小型模型。在测量数学推理的MGSM上,GPT-4o mini得分为 87.0%,而Gemini Flash得分为75.5%,Claude Haiku得分为71.7%。在测量编码性能的HumanEval上,GPT-4o mini得分为87.2%,而Gemini Flash得分为71.5%,Claude Haiku得分为75.9%。

多模态推理:GPT-4o mini在多模态推理评估MMMU中也表现出色,得分为59.4%,而Gemini Flash为56.1%,Claude Haiku为50.2%。

而且,不管你是 OpenAI 的 Plus、企业号还是 Team 账号,包括免费号,都能使用这个最新的模型!

👉 GPT功能:

  1. GPT-4o知识问答:支持1000+token上下文记忆功能
  2. 最强代码大模型Code Copilot:代码自动补全、代码优化建议、代码重构等
  3. DALL-E AI绘画:AI绘画 + 剪辑 = 自媒体新时代
  4. 私信哪吒,直接使用GPT-4o
相关推荐
My LQS10 小时前
使用 Redis Stack 向量索引构建大模型问答缓存系统
redis·缓存·ai
Yuer202510 小时前
为什么说在真正的合规体系里,“智能”是最不重要的指标之一。
人工智能·edca os·可控ai
敲键盘的生活10 小时前
MoneyPrinter重构之一:用nicegui调用大模型生成视频文案
python·重构·aigc·ai编程·ai写作
一切尽在,你来10 小时前
1.4 LangChain 1.2.7 核心架构概览
人工智能·langchain·ai编程
小邓睡不饱耶10 小时前
2026 CSDN榜单封神!3大热门技术+5个大厂案例,新手也能直接抄作业
python·ai
爱吃大芒果11 小时前
CANN ops-nn 算子开发指南:NPU 端神经网络计算加速实战
人工智能·深度学习·神经网络
聆风吟º11 小时前
CANN ops-nn 实战指南:异构计算场景中神经网络算子的调用、调优与扩展技巧
人工智能·深度学习·神经网络·cann
2601_9495936511 小时前
CANN加速人脸检测推理:多尺度特征金字塔与锚框优化
人工智能
小刘的大模型笔记11 小时前
大模型LoRA微调全实战:普通电脑落地,附避坑手册
人工智能·电脑
乾元11 小时前
身份与访问:行为生物识别(按键习惯、移动轨迹)的 AI 建模
运维·网络·人工智能·深度学习·安全·自动化·安全架构