OpenAI发布“最具性价比”模型 GPT-4o mini,GPT-3.5 Turbo 已成过去式

GPT-4o mini 相较于 GPT 3.5 在多个方面实现了显著的性能提升:

  1. 得分率提升:GPT-4o mini 在 MMLU(一个涉及多种语言理解任务的基准测试)上的得分率为 82%,优于 GPT-4,并且明显高于 GPT-3.5 2。

  2. 成本效益:GPT-4o mini 的价格比 GPT-3.5 Turbo 便宜了 60%,每百万输入 token 为 15 美分,每百万输出 token 为 60 美分,使得智能服务更加经济实惠。

  3. 长上下文性能:GPT-4o mini 支持的上下文窗口为 128K token,每个请求最多支持 16K 输出 token,这意味着它能够处理更长的对话和文本,提高了长上下文性能。

  4. 多模态能力:GPT-4o mini 支持文本和视觉输入,未来还将支持文本、图像、视频和音频输入和输出,展现了出色的多模态处理能力。

  5. 学术基准测试表现:在涉及文本和视觉的推理任务、数学推理、编码任务以及多模态推理方面,GPT-4o mini 的表现均优于市场上的其他小型模型,包括 Gemini Flash 和 Claude Haiku。

  6. 安全性:GPT-4o mini 内置了与 GPT-4o 相同的安全缓解措施,并通过自动和人工评估进行了仔细的安全性测试,提高了模型的安全性和可靠性。

  7. 改进的 Token 生成器:与 GPT-4o 共享的改进版 tokenizer 使得 GPT-4o mini 在处理非英语文本时更加经济高效。

  8. 知识更新:GPT-4o mini 的知识截止日期为 2023 年 10 月,这意味着它拥有比 GPT-3.5 更新的信息和知识库。

这些提升显示了 GPT-4o mini 在性能、成本效益、安全性和多模态处理能力等方面的全面进步,使其成为一个更具吸引力的 AI 模型选择。

相关推荐
大数据在线2 小时前
布局Agentic AI,亚马逊云科技组合拳再升级
人工智能·openai·亚马逊云科技·智能体·agentic ai
皮皮学姐分享-ppx5 小时前
政府绿色采购数据库(2015-2024.3)
大数据·网络·数据库·人工智能·制造
GIS数据转换器5 小时前
基于3D GIS的监控视频精准标定平台
人工智能·物联网·3d·音视频·无人机·知识图谱
专注VB编程开发20年6 小时前
AI 生成C# WinForm 窗体 = 目前就是垃圾
开发语言·人工智能·c#
深小乐6 小时前
Claude Fable5 尝鲜,效果挺不错
人工智能
Nayxxu6 小时前
Gemini + RAG 企业知识库教程:从文档切片到答案生成
运维·人工智能
冬奇Lab6 小时前
真正的 AI-Native Workflow 是什么?——四个判断测试
人工智能·agent
冬奇Lab6 小时前
每日一个开源项目(第128篇):Agent Skills - 给 AI 编程 Agent 装上工程纪律
人工智能·开源·资讯
Deepoch7 小时前
Deepoc VLA开发板:采摘机器人的环境鲁棒作业与不确定性应对
人工智能·机器人·采摘机器人·deepoc