免费!OpenAI发布最新模型GPT-4o mini,取代GPT3.5,GPT3.5退出历史舞台?

有个小伙伴问我,GPT-4O mini是什么,当时我还一脸懵逼,便做了一波猜测:

我猜测哈,这个可能是ChatGPT4o的前提下,只支持文本功能的版本,速度更快

结果,大错特错。

让我们一起看看OpenAI官博是怎么说的。

GPT-4o mini比GPT-3.5 Turbo更智能、更便宜。

GPT-4o mini is more than 60% cheaper than GPT-3.5 Turbo

可以这么说, ChatGPT 正式迈入了"4.0"时代。

GPT-4o mini 性价比高!3.5可以光荣退役了。。。

GPT4o mimi升级了哪些内容?

接下来将从GPT3.5 turbo、GPT4o、GPT4o mini三个模型上下对比看下

1、上下文长度
上下文长度 输出长度
GPT3.5 turbo 16K 4K
GPT4o mini 128K 16K
GPT4o 128K 4K

GPT4o mini居然在输出长度方面,超过了20美元/月的GPT4o。

2、多模态支持

GPT4o mini相较于GPT3.5 turbo只支持文本输入的基础上,又增加了图片输入,也就意味着使用GPT4o可以进行读图了

官方透露,后续会加上视频等输入方式。

3、模型质量

从返回质量上来看,GPT4o mini还是远远甩开GPT3.5 turbo几条街的。

看下官方公布的评估基准水平

4、知识截止时间

GPT4o mini模型的训练知识截止时间几乎做到了和GPT4o同样的时间

模型 知识截止时间
GPT3.5 & GPT3.5 turbo 2021年9月
GPT4.0 & GPT 4o 2023年12月
GPT4o mini 2023年10月

但,知识截止时间影响不大,因为GPT4o早已具备联网查询功能。

5、响应速度

之前速度最快的模型一直是GPT3.5,随着后来的GPT4o推出成为了最快

但是目前第三方测试来看,GPT4o相应速度是目前最快的,也许和模型较小有关系。

接下来 GPT-4 全系列包括:

  • GPT-4o:更适合复杂任务
  • GPT-4o mini:更快完成日常任务
  • GPT-4:传统模式

👉 GPT功能:

  1. GPT-4o知识问答:支持1000+token上下文记忆功能
  2. 最强代码大模型Code Copilot:代码自动补全、代码优化建议、代码重构等
  3. DALL-E AI绘画:AI绘画 + 剪辑 = 自媒体新时代
  4. 私信哪吒,直接使用GPT-4o

7月18日,OpenAI宣布推出GPT-4o mini,一个极具成本效益的小型模型。

OpenAI把GPT-4o mini描述为,一个具有卓越文本智能和多模态推理能力的小模型。

据OpenAI介绍,GPT-4o mini在MMLU上的得分为82%,目前在LMSYS排行榜上的聊天偏好方面优于GPT-4。

GPT-4o mini在文本智能和多模态推理方面的学术基准测试中超越了GPT-3.5 Turbo和其他小型模型,并且支持的语言范围与GPT-4o相同。

GPT-4o mini在函数调用方面也表现出色,可以使开发人员构建获取数据或使用外部系统采取行动的应用程序。

此外,与GPT-3.5 Turbo相比,GPT-4o mini的长上下文性能有所提高。GPT-4o mini已经在几个关键基准上进行了评估。

推理任务:GPT-4o mini在涉及文本和视觉的推理任务上优于其他小型模型,在文本智能和推理基准MMLU上的得分为82.0%,而Gemini Flash为77.9%,Claude Haiku为73.8%。

数学和编码能力:GPT-4o mini在数学推理和编码任务中的表现优于市场上之前的小型模型。在测量数学推理的MGSM上,GPT-4o mini得分为 87.0%,而Gemini Flash得分为75.5%,Claude Haiku得分为71.7%。在测量编码性能的HumanEval上,GPT-4o mini得分为87.2%,而Gemini Flash得分为71.5%,Claude Haiku得分为75.9%。

多模态推理:GPT-4o mini在多模态推理评估MMMU中也表现出色,得分为59.4%,而Gemini Flash为56.1%,Claude Haiku为50.2%。

而且,不管你是 OpenAI 的 Plus、企业号还是 Team 账号,包括免费号,都能使用这个最新的模型!

👉 GPT功能:

  1. GPT-4o知识问答:支持1000+token上下文记忆功能
  2. 最强代码大模型Code Copilot:代码自动补全、代码优化建议、代码重构等
  3. DALL-E AI绘画:AI绘画 + 剪辑 = 自媒体新时代
  4. 私信哪吒,直接使用GPT-4o
相关推荐
带刺的坐椅1 小时前
Claude Code Skills,Google A2A Skills,Solon AI Skills 有什么区别?
java·ai·solon·a2a·claudecode·skills
南宫乘风1 小时前
Claude Code 从 0 到 1 实战全攻略:掌握下一代编程 Agent 的核心能力
ai·claude·mcp
CBeann2 小时前
企业级规则引擎落地实战:动态脚本引擎 QLExpress ,真香!
java·ai·大模型·规则引擎·qlexpress·大厂实战项目
Thexhy2 小时前
Ollama 指南
ai·大模型
打破砂锅问到底0072 小时前
AI 驱动开发实战:10分钟从零构建「微信群相册」小程序
人工智能·微信·小程序·ai编程
林武2 小时前
remotion-best-practices
ai编程
水中加点糖2 小时前
小白都能看懂的——车牌检测与识别(最新版YOLO26快速入门)
人工智能·yolo·目标检测·计算机视觉·ai·车牌识别·lprnet
AGI-四顾3 小时前
文生图模型选型速览
人工智能·ai
YongCheng_Liang3 小时前
零基础学 AI:AI 基础能力夯实 —— 编程语言与工具篇
ai
Elastic 中国社区官方博客4 小时前
使用 Groq 与 Elasticsearch 进行智能查询
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索