OpenAI正式发布GPT4.1,实力不如Gemini 2.5 Pro/Claude 3.7

就在今天,OpenAI按照老传统,凌晨1点开直播宣布推出三款新模型:GPT-4.1、GPT-4.1 mini和 GPT-4.1 nano。

得知OpenAI此次发布的是GPT-4.1,还以为哪里传来的假消息,想不到居然是真的。

取名字居然倒着取,gpt 4 -> gpt4o -> gpt4 o1/o3 -> gpt 4.5 -> gpt 4.1,就有点离谱。

回归正题,给大家讲一讲OpenAI此次发布的GPT-4.1。

GPT-4.1系列是OpenAI全新的多模态模型,可看图、看视频,不能识别音频,能力要全面优于GPT-4o。

OpenAI官方表示不会整合到ChatGPT官网中,只能通过API调用,不过会将GPT-4.1的能力连续整合到GPT-4o,同时还透露,GPT-4.5预览版的API将在未来3个月后下架。

给出的原因很简单,GPT-4.1的性价比更高。(估计是GPT-4.5太贵,没人用)。

面对OpenAI这波离谱的取名操作,知名博主@小互给出自己的看法,我举双手双脚赞同。

看过此次的GPT-4o公布的成绩单,不难看出OpenAI此次推出GPT-4.1主打的就是编程。

在 SWE-bench Verified(衡量真实世界软件工程技能的指标)中,GPT-4.1的成绩超越了GPT-4o和GPT-4.5。

不过面对Gemini 2.5 Pro、C laude 3.7等模型,GPT-4.1就真的有点不够看了。

这里给大家简单介绍一下这个基准测试,Aider 的多语言基准测试对 LLMs 进行了 225 个具有挑战性的 Exercism 编程练习的测试,涵盖 C++、Go、Java、JavaScript、Python 和 Rust 等编程语言。

所以这个基准测试的可信度还是蛮高的。

在发布的短短几个小时后,网上众多大神对GPT-4.1进行来第一波实测。

提示词:编写一个使用 Pygame(或另一个合适的库)的 Python 程序,模拟几个受重力影响的弹跳球在旋转的方形内运动。球应与旋转方形墙壁发生碰撞,保持物理现实,包括速度变化、重力效果和旋转感知的碰撞检测。还有网友将GPT-4.1、GPT-4.1-mini、GPT-4.1-nano以及GPT-4.5生成此前很火的球在六边形滚动的代码。

最稳定的就是GPT4.1和GPT-4.5了,GPT-4.1-nano表现就有点辣眼睛了。

还有沃顿商学院教授Ethan Mollick用GPT-4.1去生成飞船控制面板的p5js。他觉得,相较于GPT-4,GPT-4.1进步非常大,整体上表现出色。

从以上例子可以看出,GPT-4.1的编码确实还可以,但是对比Gemini-2.5 Pro和Claude 3.7 Sonnet来说,真的不够打的。

最后给大家公布一下大家最关心的价格,也是此次最大的亮点了。

GPT-4.1每百万Token的输入价格是2美金,每百万Token的输出价格是8美金。

而号称OpenAI史上最便宜API的GPT-4.1-nano每百万Token的输入价格是0.1美金,每百万Token的输出价格是0.4美金。

实话实说,这价格有点不像OpenAI的风格啊,这是计划把高端模型和底端模型全部包围的节奏啊,价格已经和Deepseek有得一拼了,但效果差得可有点远了。

如果大家还不会获取OpenAI的API Key,可以看我之前的文章,里面详细介绍了如何获取 OpenAI API Key的方法和如何解决支付难题的详细方法。

相关阅读:【2025最新】ChatGPT/Claude API如何获取?(国内使用和购买指南)

最后问大家一个开放性的问题,没有答案,可以畅所欲言:真的会有人用GPT-4.1的API吗?

欢迎大家在评论区分享对GPT-4.5的看法。

相关推荐
陈敬雷-充电了么-CEO兼CTO15 小时前
强化学习三巨头PK:PPO、GRPO、DPO谁是大模型训练的「王炸」?
人工智能·python·机器学习·chatgpt·aigc·ppo·grpo
SEO_juper21 小时前
从人工到智能:SEO测试工作流的AI集成框架与ROI提升方案
人工智能·ai·chatgpt·工具·seo·数字营销
曼波编程1 天前
ChatGPT Agent全解析:从多任务处理到实操指南
chatgpt
wshzd1 天前
LLM之RAG理论(十八)| ChatGPT DeepResearch 深度研究功能全面技术分析报告
人工智能·chatgpt
蓑雨春归2 天前
自主智能Agent如何重塑工作流自动化:技术、经济与未来展望
人工智能·chatgpt·自动化
福宝plus3 天前
教你如何使用ChatGPT Agent,Agent使用次数限制,以及实际体验感受
chatgpt·openai·agent
陈敬雷-充电了么-CEO兼CTO3 天前
字节跳动开源Coze,开启AI Agent开发新时代?
人工智能·gpt·chatgpt·开源·大模型·agi·coze
强德亨上校3 天前
2025年7月21–28日AI开发周报:新模型、新战略与开源亮点
人工智能·科技·gpt·chatgpt·开源·aigc
DM今天肝到几点?3 天前
【7.26-7.28胜算云AI日报:首个开源3D世界生成模型腾讯混元、微软预示 8 月 GPT-5 发布、Nemotron推理、商汤悟能、DM夺金】
人工智能·vscode·microsoft·3d·ai·chatgpt
vvandre4 天前
ChatGPT桌面版深度解析
chatgpt