OpenAI的新AI机器人gpt-4o-latest在LMSYS跑分中重新夺回第一名

上周,OpenAI 发布了其最新的前沿模型,正式命名为 gpt-4o-2024-08-06,该新模型在API中支持结构化输出。昨天,OpenAI出人意料地宣布了另一个名为chatgpt-4o-latest的新前沿模型。虽然OpenAI仍建议开发人员将gpt-4o-2024-08-06用于大多数API使用,但chatgpt-4o-latest模型将允许开发人员测试OpenAI在聊天用例方面的最新改进。

根据OpenAI的官方文档页面,chatgpt-4o-latest将是一个动态模型,将不断更新到ChatGPT中GPT-4o的最新版本。新的chatgpt-4o-latest模型支持128000个标记和16384个输出标记的上下文。该模型仅用于研究和评估。

上周,Google在LMSYS聊天机器人跑分系统中上架了一款新的实验性Gemini 1.5 Pro模型,以1297分的成绩夺得第一名。这是自聊天机器人竞技场发布以来,Google首次登顶。凭借最新的聊天gpt-4o模型,OpenAI以1314分的创纪录成绩重新夺回竞技场第一的位置。根据得分,新的ChatGPT-4o在编程、指令执行和硬提示方面都有显著提升。

LMSYS聊天机器人竞技场中新的ChatGPT-4o类别排名:

综合:第一名

数学:第1-2名

编程:第一名

硬提示:第一名

指令遵循:第一名

较长的查询:第一名

多轮:第一名

这款最新的聊天gpt-4o模型自上周以来一直在为OpenAI的ChatGPT提供支持。如果您注意到ChatGPT的响应在过去一周有所改进,可以肯定地说,这是因为有了新的模型。

OpenAI最近宣布了2024年开发者大会(DevDay 2024)的消息,该大会将在全球三个城市举行。在宣布消息时,OpenAI明确表示不会在这些活动中透露他们今年早些时候开始训练的下一个重大前沿模型。相反,这些开发者活动将专注于API和开发工具的改进。

感谢大家花时间阅读我的文章,你们的支持是我不断前进的动力。期望未来能为大家带来更多有价值的内容,请多多关注我的动态!

相关推荐
self-motivation1 分钟前
征机器人领域主流模型量化,评测,优化,部署工具model_optimizer的开源合作开发
yolo·机器人·量化·foundationpose·pi0.5
m0_488913012 分钟前
Deep Research技术全解析:从Reasoning到Research with Reasoning的AI进化之路(值得收藏)
开发语言·人工智能·机器学习·大模型·ai大模型·大模型学习
雪兽软件4 分钟前
在企业中实施人工智能的关键步骤
人工智能
大写-凌祁5 分钟前
硬核劝学:2026年 AI 工程师“飞升”指南 (LLM/RL/VLM/AIGC 全路线)
人工智能·aigc
leo_23214 分钟前
SMP(软件制作平台)接入AI实例--金陵书匣
人工智能·开发工具·smp软件制作平台
python零基础入门小白14 分钟前
2025年大模型面试通关秘籍!大厂高频LLMs真题全解析,一文掌握,助你轻松斩获心仪offer!
开发语言·人工智能·语言模型·架构·langchain·大模型教程·大模型面试
LinQingYanga23 分钟前
极客时间AI 算法进阶训练营 毕业总结(2025年11月30日)
人工智能
Brduino脑机接口技术答疑34 分钟前
脑机接口数据处理连载(二) 数据源头解析:脑电信号的采集原理与数据特性
人工智能·python·算法·数据分析·脑机接口
Coding茶水间35 分钟前
基于深度学习的火焰检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
图像处理·人工智能·深度学习·yolo·目标检测·计算机视觉
后端小肥肠38 分钟前
n8n+Coze+飞书:公众号对标文章一键录入+深度拆解,打造你的【爆款素材库】
人工智能·agent·coze