OpenAI发布“最具性价比”模型 GPT-4o mini,GPT-3.5 Turbo 已成过去式

GPT-4o mini 相较于 GPT 3.5 在多个方面实现了显著的性能提升:

  1. 得分率提升:GPT-4o mini 在 MMLU(一个涉及多种语言理解任务的基准测试)上的得分率为 82%,优于 GPT-4,并且明显高于 GPT-3.5 2。

  2. 成本效益:GPT-4o mini 的价格比 GPT-3.5 Turbo 便宜了 60%,每百万输入 token 为 15 美分,每百万输出 token 为 60 美分,使得智能服务更加经济实惠。

  3. 长上下文性能:GPT-4o mini 支持的上下文窗口为 128K token,每个请求最多支持 16K 输出 token,这意味着它能够处理更长的对话和文本,提高了长上下文性能。

  4. 多模态能力:GPT-4o mini 支持文本和视觉输入,未来还将支持文本、图像、视频和音频输入和输出,展现了出色的多模态处理能力。

  5. 学术基准测试表现:在涉及文本和视觉的推理任务、数学推理、编码任务以及多模态推理方面,GPT-4o mini 的表现均优于市场上的其他小型模型,包括 Gemini Flash 和 Claude Haiku。

  6. 安全性:GPT-4o mini 内置了与 GPT-4o 相同的安全缓解措施,并通过自动和人工评估进行了仔细的安全性测试,提高了模型的安全性和可靠性。

  7. 改进的 Token 生成器:与 GPT-4o 共享的改进版 tokenizer 使得 GPT-4o mini 在处理非英语文本时更加经济高效。

  8. 知识更新:GPT-4o mini 的知识截止日期为 2023 年 10 月,这意味着它拥有比 GPT-3.5 更新的信息和知识库。

这些提升显示了 GPT-4o mini 在性能、成本效益、安全性和多模态处理能力等方面的全面进步,使其成为一个更具吸引力的 AI 模型选择。

相关推荐
湫ccc5 分钟前
《Opencv》基础操作详解(2)
人工智能·opencv·计算机视觉
羑悻的小杀马特5 分钟前
【AIGC篇】畅谈游戏开发设计中AIGC所发挥的不可或缺的作用
c++·人工智能·aigc·游戏开发
CES_Asia15 分钟前
国资助力科技创新,闪耀CES Asia 2025
人工智能·科技·智能手机·智能音箱·智能电视
eric-sjq37 分钟前
基于xiaothink对Wanyv-50M模型进行c-eval评估
人工智能·python·语言模型·自然语言处理·github
是十一月末1 小时前
机器学习之KNN算法预测数据和数据可视化
人工智能·python·算法·机器学习·信息可视化
工业互联网专业1 小时前
基于OpenCV和Python的人脸识别系统_django
人工智能·python·opencv·django·毕业设计·源码·课程设计
ai产品老杨1 小时前
报警推送消息升级的名厨亮灶开源了。
vue.js·人工智能·安全·开源·音视频
智源研究院官方账号1 小时前
智源研究院与安谋科技达成战略合作,共建开源AI“芯”生态
人工智能·开源
积兆科技1 小时前
从汽车企业案例看仓网规划的关键步骤(视频版)
人工智能·算法·汽车·制造
Robot2512 小时前
「地平线」副总裁余轶南与「理想汽车」智驾产品总监赵哲伦联手创业,入局具身智能赛道!
大数据·人工智能·机器人·汽车