2024年5月14日凌晨,OpenAI 在首次「春季新品发布会」上发布了新一代旗舰生成模型 GPT-4o、桌面应用程序,并展示了一系列新功能和能力。
主要亮点
- 免费优先 :以后 OpenAI 做产品的原则是免费优先,目的是让更多的人能够使用这些先进的工具。
- 桌面版本和更新的 UI :此次发布包括桌面版本的程序和更新后的 UI,使用更加简单自然。
- 新一代大模型 GPT-4o:GPT-4o 的特别之处在于它以极为自然的交互方式为每个人带来了 GPT-4 级别的智能,包括免费用户。
什么是 GPT-4o?
GPT-4o 是 OpenAI 的新旗舰模型,能够实时处理音频、视觉和文本。它将首先在 ChatGPT 和 API 中作为文本和视觉模型提供(ChatGPT 将继续支持通过现有的语音模式功能进行语音交互)。具体来说,GPT-4o 将在 ChatGPT 的免费版、Plus 版和 Team 版中提供(企业版即将推出),以及在聊天完成 API、助手 API 和批处理 API 中提供。
GPT-4o 与 GPT-4 Turbo 的区别
- 定价:GPT-4o 比 GPT-4 Turbo 便宜50%,输入每百万 tokens 费用为 5 美元,输出每百万 tokens 费用为 15 美元。
- 速率限制:GPT-4o 的速率限制比 GPT-4 Turbo 高5倍------每分钟最多可处理1000万个 tokens。
- 速度:GPT-4o 比 GPT-4 Turbo 快2倍。
- 视觉能力:GPT-4o 在与视觉相关的评估中表现优于 GPT-4 Turbo。
- 多语言支持:GPT-4o 对非英语语言的支持比 GPT-4 Turbo 有所改善。
简而言之,OpenAI 公布了一款可以免费使用的模型 GPT-4o,它的能力甚至比 GPT-4 更强。
消息数量限制
免费用户可以使用 GPT-4o 发送的消息数量将受到限制。当达到限制时,ChatGPT 将自动切换到 GPT-3.5。具体限制如下:
- 从2024年5月13日起,Plus 用户每3小时可以发送最多80条使用 GPT-4o 的消息和最多40条使用 GPT-4 的消息。在高峰时段,可能会减少限制,以使 GPT-4 和 GPT-4o 能被更多人访问。
- ChatGPT Team 工作区用户的 GPT-4 和 GPT-4o 消息上限高于 ChatGPT Plus 用户。
请注意,未使用的消息不会累积(即如果您等待6小时,您在接下来的3小时内仍然只能使用80条 GPT-4 的消息)。
未来的交互方式
这次更新后,大模型可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合输出------这才是属于未来的交互方式。
此外,GPT-4o 在理解和生成图像方面的能力比任何现有模型都要好得多,此前许多不可能的任务都变得「易如反掌」。
例如:
-
更自然的人机交互:识别人的语气,实时识别,并可以被打断,使得交流更像人与人之间的互动。
-
实时识别图像能力:通过手机摄像头实时分析图像。
-
分析代码能力:可以上传代码并进行分析。
-
实时分析图表:具备强大的图表分析能力。
-
实时翻译:可以无缝翻译,例如演示中展示了意大利语和英语的实时翻译,甚至可以翻译成第三人称。
新的 ChatGPT 桌面应用程序
OpenAI 还推出了适用于 macOS 的新 ChatGPT 桌面应用程序。通过简单的键盘快捷键(Option + Space),用户可以立即向 ChatGPT 提问。此外,用户还可以直接在应用程序中截取屏幕截图并进行讨论。
从今天开始,OpenAI 将向 Plus 用户推出 macOS 应用程序,并将在未来几周内更广泛地提供该应用程序。此外,今年晚些时候 OpenAI 会推出 Windows 版本。
现在,用户还可以直接从计算机与 ChatGPT 进行语音对话,GPT-4o 的音频和视频功能将在未来推出,通过点击桌面应用程序右下角的耳机图标来开始语音对话。
个人思考
私以为,既然能将这么强的模型放出来,是不是gpt5已经不远了,那sora又会何时公布呢。按以往的经验,都是付费用户优先灰度使用或抢先体验。预测一波今年11月将会有重磅发布!
如果有账号需求或者升级plus的可以参考下:十一呓语:如何升级ChatGPT Plus
或者后台联系我 或者加微信:572874317,备注:chatgpt