OpenAI发布“最具性价比”模型 GPT-4o mini,GPT-3.5 Turbo 已成过去式

GPT-4o mini 相较于 GPT 3.5 在多个方面实现了显著的性能提升:

  1. 得分率提升:GPT-4o mini 在 MMLU(一个涉及多种语言理解任务的基准测试)上的得分率为 82%,优于 GPT-4,并且明显高于 GPT-3.5 2。

  2. 成本效益:GPT-4o mini 的价格比 GPT-3.5 Turbo 便宜了 60%,每百万输入 token 为 15 美分,每百万输出 token 为 60 美分,使得智能服务更加经济实惠。

  3. 长上下文性能:GPT-4o mini 支持的上下文窗口为 128K token,每个请求最多支持 16K 输出 token,这意味着它能够处理更长的对话和文本,提高了长上下文性能。

  4. 多模态能力:GPT-4o mini 支持文本和视觉输入,未来还将支持文本、图像、视频和音频输入和输出,展现了出色的多模态处理能力。

  5. 学术基准测试表现:在涉及文本和视觉的推理任务、数学推理、编码任务以及多模态推理方面,GPT-4o mini 的表现均优于市场上的其他小型模型,包括 Gemini Flash 和 Claude Haiku。

  6. 安全性:GPT-4o mini 内置了与 GPT-4o 相同的安全缓解措施,并通过自动和人工评估进行了仔细的安全性测试,提高了模型的安全性和可靠性。

  7. 改进的 Token 生成器:与 GPT-4o 共享的改进版 tokenizer 使得 GPT-4o mini 在处理非英语文本时更加经济高效。

  8. 知识更新:GPT-4o mini 的知识截止日期为 2023 年 10 月,这意味着它拥有比 GPT-3.5 更新的信息和知识库。

这些提升显示了 GPT-4o mini 在性能、成本效益、安全性和多模态处理能力等方面的全面进步,使其成为一个更具吸引力的 AI 模型选择。

相关推荐
后端小肥肠33 分钟前
公众号躺更神器!OpenClaw+Claude Skill 实现自动读对标 + 写文 + 配图 + 存入草稿箱
人工智能·aigc·agent
爱可生开源社区41 分钟前
SCALE | 重构 AI 时代数据库能力的全新评估标准
人工智能
Jahzo1 小时前
openclaw本地化部署体验与踩坑记录--飞书机器人配置
人工智能·开源
Narrastory1 小时前
明日香 - Pytorch 快速入门保姆级教程(一)
人工智能·pytorch·深度学习
数据智能老司机1 小时前
用于进攻性网络安全的智能体 AI——在 n8n 中构建你的第一个 AI 工作流
人工智能·安全·agent
数据智能老司机1 小时前
用于进攻性网络安全的智能体 AI——智能体 AI 入门
人工智能·安全·agent
Narrastory1 小时前
明日香 - Pytorch 快速入门保姆级教程(二)
人工智能·pytorch·深度学习
AI攻城狮1 小时前
OpenClaw Session 管理完全指南:Context 压缩、重置与持久化
人工智能·云原生·aigc
中杯可乐多加冰3 小时前
OpenClaw到底能做什么?有什么用?先装这几个实用的Skills
人工智能
千寻girling3 小时前
一份不可多得的 《 Python 》语言教程
人工智能·后端·python