GPT‑4.1重磅发布,专为开发者设计,百万token上下文,ChatGPT4o的全面升级

一、GPT‑4.1发布

4月14日,OpenAI在API中推出了三款新车型:GPT‑4.1、GPT‑4.1 mini和GPT‑4.1 nano。

  1. GPT‑4.1 nano:迄今为止最便宜、速度最快的模型,适合低延迟的简单任务;
  2. GPT-4.1 mini:能力与之前的GPT-4o旗鼓相当,但延迟降低了近一半,成本降低了 83%;
  3. GPT‑4.1:ChatGPT4o的全面升级,编码、指令遵循、图像理解、学术知识、上下文长度、价格等诸多方面提升明显。

如下图所示:

横坐标latency(延迟)、纵坐标intelligence(智能),GPT-4.1比GPT-4o强了一点,而4.1 mini则超出了4o mini一大截。

很明显,这次更新的主角是GPT-4.1模型。

OpenAI表示,史上最贵模型GPT‑4.5预览版将在3个月后,即2025年7月14日关闭,取而代之的是价格更加亲民、性能更加强大的GPT-4.1。

二、编码

GPT-4.1在各种编码任务上明显优于GPT-4o,主要体现在以下几个方面:

  1. **前端编码能力增强:**在处理前端开发任务时表现出更高的准确性和效率,能够更好地理解和生成相关代码。
  2. **减少不必要的编辑:**GPT-4.1在生成代码时,能够避免多余的修改,保持代码的简洁性和可读性。
  3. **可靠地遵循不同的格式:**模型能够准确地生成符合不同格式的代码更改,方便开发者进行版本控制和代码审查。
  4. **确保工具使用的一致性:**GPT-4.1 在使用开发工具和库时,能够保持一致性,减少因工具使用不当导致的错误。

在测试实际软件工程技能的sw-bench Verified测试中,GPT‑4.1完成了54.6%的任务,而GPT‑4o(2024-11-20)完成了33.2%的任务,甚至比OpenAI史上最贵模型GPT-4.5高出17%,简直离谱。 这反映了模型探索代码存储库、完成任务和生成运行并通过测试的代码的能力的改进。

GPT-4.1在前端编码方面也大大改进了GPT-4o,并且能够创建功能更强大、更美观的web应用程序。在 head-to-head 对比中,GPT-4.1 的网站比 GPT-4o 的网站更受欢迎。

三、指令遵循

GPT-4.1在指令遵循方面有显著提升,研究人员强调了模型的可靠性改进,指出他们"使模型在指令遵循方面变得更好"。

根据开发者的反馈,对GPT-4.1在各种指令遵循方面进行了针对性的改进:

  1. 不再胡说八道,如果请求的信息不可用,或者没有一个明确的答案,GPT4.1会直接返回"我不知道"或类似的话。不会根据提示词而改变最初的回答。
  2. 支持负面指定,比如避免某某行为
  3. 可以执行指定顺序的指令,支持以指定顺序输出内容
  4. 支持返回指定格式的数据,比如XML、YAML、Markdown等。

四、上下文长度

GPT-4.1、GPT-4.1 mini和GPT-4.1 nano拥有100万token的输入上下文窗口,可用于多种长文本任务,包括结构化文档解析、信息筛选和多跳推理 Openai。这对处理学术文献、长篇论文和复杂研究材料特别有用。

五、学术知识

GPT-4.1 在学术知识方面的提升主要体现在 MMLU 基准测试中,取得 90.2% 的分数,相比之下,之前的 GPT-4 在同一测试中得分为 85.7%。这表明 GPT-4.1 在跨多个学科的学术知识和问题解决能力上有所进步。此外,GPT-4.1 的知识截止日期为 2024年6月,意味着它可能包含更新的学术信息,增强了其在当前学术领域的适用性。

与前代模型ChatGPT4o相比,新模型在语义理解、知识百科和上下文对话等方面表现更好,能更好地理解中文,且输出格式更便于直接使用。

#### 国内直接使用最新GPT4.1、GPT-4.5、满血ChatGPT4o、o1、o3-mini-high、满血DeepSeek R1、马斯克Grok 3

✅️谷歌浏览器直接访问

ChatGPT使用地址:www.nezhasoft.cloud

Claude使用地址:claude.nezhagpt.cloud

一、纯原版ChatGPT、Claude

✅️官网原生页面

✅️真实Team会员账号

二、技术支持

✔️支持最新GPT-4.1、GPT-4.5、满血ChatGPT-4o、o1、o3-mini-high、o1 pro

✔️支持Claude 3.7 Sonnent

✔️支持满血DeepSeek R1、Grok 3

✔️无需魔法、个人独享

三、搜索GPT(支持100+AI插件)、自定义插件

支持ChatGPT所有插件,可创建自己的ChatGPT插件,使用朋友分享的自定义插件。

例如最强编程插件Code Copilot、AI绘画插件DALL-E、论文专属Consensus、搜索文献插件Scholar GPT。

相关推荐
墨风如雪15 分钟前
告别“面目全非”!腾讯混元3D变身“建模艺术家”,建模效率直接起飞!
aigc
iThinkAi智能体4 小时前
最新Coze(扣子)智能体工作流:1分钟生成10W+爆款橘猫生活日常视频,零剪辑基础
aigc
一tiao咸鱼5 小时前
如何简单使用 prompt
前端·aigc
kebijuelun5 小时前
百度文心 4.5 大模型详解:ERNIE 4.5 Technical Report
人工智能·深度学习·百度·语言模型·自然语言处理·aigc
新智元5 小时前
毕业 7 年,身价破亿!清北 AI 天团血洗硅谷,奥特曼被逼分天价股份
人工智能·openai
新智元6 小时前
刚刚,苹果大模型团队负责人叛逃 Meta!华人 AI 巨星 + 1,年薪飙至 9 位数
人工智能·openai
掉鱼的猫6 小时前
Java MCP 实战:构建跨进程与远程的工具服务
java·openai·mcp
不大姐姐AI智能体7 小时前
Coze智能体工作流:1分钟生成10w+爆款今日语录视频,全自动,无需剪辑
aigc
用户30742971671587 小时前
LLM-as-a-Judge :构建可扩展的自动化 AI 评估体系
llm·aigc
哪吒编程11 小时前
马斯克掀起"帐篷文化",Grok4即将发布,碾压Gemini 2.5 Pro、Claude Opus 4,国内直接使用
openai·grok