GPT‑4.1重磅发布,专为开发者设计,百万token上下文,ChatGPT4o的全面升级

一、GPT‑4.1发布

4月14日,OpenAI在API中推出了三款新车型:GPT‑4.1、GPT‑4.1 mini和GPT‑4.1 nano。

  1. GPT‑4.1 nano:迄今为止最便宜、速度最快的模型,适合低延迟的简单任务;
  2. GPT-4.1 mini:能力与之前的GPT-4o旗鼓相当,但延迟降低了近一半,成本降低了 83%;
  3. GPT‑4.1:ChatGPT4o的全面升级,编码、指令遵循、图像理解、学术知识、上下文长度、价格等诸多方面提升明显。

如下图所示:

横坐标latency(延迟)、纵坐标intelligence(智能),GPT-4.1比GPT-4o强了一点,而4.1 mini则超出了4o mini一大截。

很明显,这次更新的主角是GPT-4.1模型。

OpenAI表示,史上最贵模型GPT‑4.5预览版将在3个月后,即2025年7月14日关闭,取而代之的是价格更加亲民、性能更加强大的GPT-4.1。

二、编码

GPT-4.1在各种编码任务上明显优于GPT-4o,主要体现在以下几个方面:

  1. **前端编码能力增强:**在处理前端开发任务时表现出更高的准确性和效率,能够更好地理解和生成相关代码。
  2. **减少不必要的编辑:**GPT-4.1在生成代码时,能够避免多余的修改,保持代码的简洁性和可读性。
  3. **可靠地遵循不同的格式:**模型能够准确地生成符合不同格式的代码更改,方便开发者进行版本控制和代码审查。
  4. **确保工具使用的一致性:**GPT-4.1 在使用开发工具和库时,能够保持一致性,减少因工具使用不当导致的错误。

在测试实际软件工程技能的sw-bench Verified测试中,GPT‑4.1完成了54.6%的任务,而GPT‑4o(2024-11-20)完成了33.2%的任务,甚至比OpenAI史上最贵模型GPT-4.5高出17%,简直离谱。 这反映了模型探索代码存储库、完成任务和生成运行并通过测试的代码的能力的改进。

GPT-4.1在前端编码方面也大大改进了GPT-4o,并且能够创建功能更强大、更美观的web应用程序。在 head-to-head 对比中,GPT-4.1 的网站比 GPT-4o 的网站更受欢迎。

三、指令遵循

GPT-4.1在指令遵循方面有显著提升,研究人员强调了模型的可靠性改进,指出他们"使模型在指令遵循方面变得更好"。

根据开发者的反馈,对GPT-4.1在各种指令遵循方面进行了针对性的改进:

  1. 不再胡说八道,如果请求的信息不可用,或者没有一个明确的答案,GPT4.1会直接返回"我不知道"或类似的话。不会根据提示词而改变最初的回答。
  2. 支持负面指定,比如避免某某行为
  3. 可以执行指定顺序的指令,支持以指定顺序输出内容
  4. 支持返回指定格式的数据,比如XML、YAML、Markdown等。

四、上下文长度

GPT-4.1、GPT-4.1 mini和GPT-4.1 nano拥有100万token的输入上下文窗口,可用于多种长文本任务,包括结构化文档解析、信息筛选和多跳推理 Openai。这对处理学术文献、长篇论文和复杂研究材料特别有用。

五、学术知识

GPT-4.1 在学术知识方面的提升主要体现在 MMLU 基准测试中,取得 90.2% 的分数,相比之下,之前的 GPT-4 在同一测试中得分为 85.7%。这表明 GPT-4.1 在跨多个学科的学术知识和问题解决能力上有所进步。此外,GPT-4.1 的知识截止日期为 2024年6月,意味着它可能包含更新的学术信息,增强了其在当前学术领域的适用性。

与前代模型ChatGPT4o相比,新模型在语义理解、知识百科和上下文对话等方面表现更好,能更好地理解中文,且输出格式更便于直接使用。

#### 国内直接使用最新GPT4.1、GPT-4.5、满血ChatGPT4o、o1、o3-mini-high、满血DeepSeek R1、马斯克Grok 3

✅️谷歌浏览器直接访问

ChatGPT使用地址:www.nezhasoft.cloud

Claude使用地址:claude.nezhagpt.cloud

一、纯原版ChatGPT、Claude

✅️官网原生页面

✅️真实Team会员账号

二、技术支持

✔️支持最新GPT-4.1、GPT-4.5、满血ChatGPT-4o、o1、o3-mini-high、o1 pro

✔️支持Claude 3.7 Sonnent

✔️支持满血DeepSeek R1、Grok 3

✔️无需魔法、个人独享

三、搜索GPT(支持100+AI插件)、自定义插件

支持ChatGPT所有插件,可创建自己的ChatGPT插件,使用朋友分享的自定义插件。

例如最强编程插件Code Copilot、AI绘画插件DALL-E、论文专属Consensus、搜索文献插件Scholar GPT。

相关推荐
Blossom.11815 小时前
《从零开始:构建你的第一个区块链应用》
人工智能·驱动开发·python·深度学习·区块链·aigc·交互
郭不耐18 小时前
DeepSeek智能时空数据分析(八):NL2SQL绘制河流-轨迹缓冲区如何生成
大数据·数据分析·云计算·aigc·数据可视化
DisonTangor1 天前
【字节拥抱开源】字节豆包团队开源首发 Seed-Coder 大模型
人工智能·开源·aigc
s1ckrain2 天前
【论文阅读】HunyuanVideo: A Systematic Framework For Large Video Generative Models
论文阅读·计算机视觉·aigc
OJAC近屿智能2 天前
英伟达发布Llama-Nemotron系列新模型,性能超越DeepSeek-R1
大数据·人工智能·ui·aigc·llama
AI掘金3 天前
DeepSeek实战--蒸馏
微调·aigc·蒸馏·ai应用·deepseek·小模型推理
DisonTangor3 天前
LLaMA-Omni 2:基于 LLM 的自回归流语音合成实时口语聊天机器人
人工智能·开源·aigc·音视频·llama
AI掘金3 天前
DeepSeek实战--微调
ai·大模型·aigc·大模型微调·ai应用
虹科网络安全3 天前
艾体宝方案丨深度解析生成式 AI 安全风险,Lepide 为数据安全护航
人工智能·aigc·ai监控·lepide·ai安全风险