免费!OpenAI发布最新模型GPT-4o mini,取代GPT-3.5,GPT-3.5退出历史舞台?

有个小伙伴问我,GPT-4O mini是什么,当时我还一脸懵逼,便做了一波猜测:

我猜测哈,这个可能是ChatGPT4o的前提下,只支持文本功能的版本,速度更快

结果,大错特错。

让我们一起看看OpenAI官博是怎么说的。

GPT-4o mini比GPT-3.5 Turbo更智能、更便宜。

GPT-4o mini is more than 60% cheaper than GPT-3.5 Turbo

可以这么说, ChatGPT 正式迈入了"4.0"时代。

GPT-4o mini 性价比高!3.5可以光荣退役了。。。

GPT4o mimi升级了哪些内容?

接下来将从GPT3.5 turbo、GPT4o、GPT4o mini三个模型上下对比看下

1、上下文长度
上下文长度 输出长度
GPT3.5 turbo 16K 4K
GPT4o mini 128K 16K
GPT4o 128K 4K

GPT4o mini居然在输出长度方面,超过了20美元/月的GPT4o。

2、多模态支持

GPT4o mini相较于GPT3.5 turbo只支持文本输入的基础上,又增加了图片输入,也就意味着使用GPT4o可以进行读图了

官方透露,后续会加上视频等输入方式。

3、模型质量

从返回质量上来看,GPT4o mini还是远远甩开GPT3.5 turbo几条街的。

看下官方公布的评估基准水平

4、知识截止时间

GPT4o mini模型的训练知识截止时间几乎做到了和GPT4o同样的时间

模型 知识截止时间
GPT3.5 & GPT3.5 turbo 2021年9月
GPT4.0 & GPT 4o 2023年12月
GPT4o mini 2023年10月

但,知识截止时间影响不大,因为GPT4o早已具备联网查询功能。

5、响应速度

之前速度最快的模型一直是GPT3.5,随着后来的GPT4o推出成为了最快

但是目前第三方测试来看,GPT4o相应速度是目前最快的,也许和模型较小有关系。

接下来 GPT-4 全系列包括:

  • GPT-4o:更适合复杂任务
  • GPT-4o mini:更快完成日常任务
  • GPT-4:传统模式

👉 GPT功能:

  1. GPT-4o知识问答:支持1000+token上下文记忆功能
  2. 最强代码大模型Code Copilot:代码自动补全、代码优化建议、代码重构等
  3. DALL-E AI绘画:AI绘画 + 剪辑 = 自媒体新时代
  4. 私信哪吒,直接使用GPT-4o

7月18日,OpenAI宣布推出GPT-4o mini,一个极具成本效益的小型模型。

OpenAI把GPT-4o mini描述为,一个具有卓越文本智能和多模态推理能力的小模型。

据OpenAI介绍,GPT-4o mini在MMLU上的得分为82%,目前在LMSYS排行榜上的聊天偏好方面优于GPT-4。

GPT-4o mini在文本智能和多模态推理方面的学术基准测试中超越了GPT-3.5 Turbo和其他小型模型,并且支持的语言范围与GPT-4o相同。

GPT-4o mini在函数调用方面也表现出色,可以使开发人员构建获取数据或使用外部系统采取行动的应用程序。

此外,与GPT-3.5 Turbo相比,GPT-4o mini的长上下文性能有所提高。GPT-4o mini已经在几个关键基准上进行了评估。

推理任务:GPT-4o mini在涉及文本和视觉的推理任务上优于其他小型模型,在文本智能和推理基准MMLU上的得分为82.0%,而Gemini Flash为77.9%,Claude Haiku为73.8%。

数学和编码能力:GPT-4o mini在数学推理和编码任务中的表现优于市场上之前的小型模型。在测量数学推理的MGSM上,GPT-4o mini得分为 87.0%,而Gemini Flash得分为75.5%,Claude Haiku得分为71.7%。在测量编码性能的HumanEval上,GPT-4o mini得分为87.2%,而Gemini Flash得分为71.5%,Claude Haiku得分为75.9%。

多模态推理:GPT-4o mini在多模态推理评估MMMU中也表现出色,得分为59.4%,而Gemini Flash为56.1%,Claude Haiku为50.2%。

而且,不管你是 OpenAI 的 Plus、企业号还是 Team 账号,包括免费号,都能使用这个最新的模型!

👉 GPT功能:

  1. GPT-4o知识问答:支持1000+token上下文记忆功能
  2. 最强代码大模型Code Copilot:代码自动补全、代码优化建议、代码重构等
  3. DALL-E AI绘画:AI绘画 + 剪辑 = 自媒体新时代
  4. 私信哪吒,直接使用GPT-4o
相关推荐
لا معنى له10 小时前
目标检测的内涵、发展和经典模型--学习笔记
人工智能·笔记·深度学习·学习·目标检测·机器学习
AKAMAI11 小时前
Akamai Cloud客户案例 | CloudMinister借助Akamai实现多云转型
人工智能·云计算
小a杰.13 小时前
Flutter 与 AI 深度集成指南:从基础实现到高级应用
人工智能·flutter
colorknight13 小时前
数据编织-异构数据存储的自动化治理
数据仓库·人工智能·数据治理·数据湖·数据科学·数据编织·自动化治理
Lun3866buzha13 小时前
篮球场景目标检测与定位_YOLO11-RFPN实现详解
人工智能·目标检测·计算机视觉
janefir14 小时前
LangChain框架下DirectoryLoader使用报错zipfile.BadZipFile
人工智能·langchain
齐齐大魔王14 小时前
COCO 数据集
人工智能·机器学习
AI营销实验室15 小时前
原圈科技AI CRM系统赋能销售新未来,行业应用与创新点评
人工智能·科技
爱笑的眼睛1115 小时前
超越MSE与交叉熵:深度解析损失函数的动态本质与高阶设计
java·人工智能·python·ai
tap.AI15 小时前
RAG系列(一) 架构基础与原理
人工智能·架构