OpenAI 模型命名(GPT-5)

一、OpenAI模型命名规则解析

OpenAI的命名体系通过基础名称+版本号+功能后缀的组合反映模型定位,具体规则如下:

  1. 主版本号(如GPT-3/4/5)

    • 数字越大代表技术代际越新,核心架构升级(如GPT-4支持多模态,GPT-5统一产品线)。
  2. 字母后缀

    • o:代表"omni"(全能),支持多模态输入输出(如GPT-4o支持文本、图像、音频)。
    • oss:开源模型标识(如gpt-oss-120b)。
  3. 性能后缀

    • Turbo:响应速度优化版(如GPT-3.5 Turbo)。
    • Pro:增强性能版(如o1-pro)。
    • mini:轻量级版本,资源占用低(如o4-mini)。
  4. 专用系列

    • O系列:专注逻辑推理与工具调用(如O3、O4-mini)。
    • DALL·E/Sora:图像/视频生成专用模型。

二、常见模型清单与对比

1. 商业闭源模型

模型名称 类型 发布时间 核心能力与参数 典型应用场景 多模态支持
GPT-5 全能多模态 2024年8月 文本/图像/音频/视频交互,400K上下文 跨媒体创作、实时会议纪要 ✅ 全支持
GPT-4o 全能多模态 2024年5月 文本/图像/音频/视频交互,128K上下文 跨媒体创作、实时会议纪要 ✅ 全支持
GPT-4.5 文本优化 2025年2月 情感表达优化,32K上下文 社交媒体文案、客户沟通
o3 推理旗舰 2025年4月 复杂逻辑推理,工具调用,视觉推理 科研分析、商业决策 🟡 有限支持
o4-mini 轻量推理 2025年4月 200K上下文,低成本高吞吐 数据清洗、编程辅助
GPT-4.1 长文本处理 2025年4月 100万Token上下文,精准指令执行 法律合同分析、金融文档审核
DALL·E 3 图像生成 2024年 高分辨率图像生成与编辑 创意设计、营销素材生成 ✅ 图像
Sora 视频生成 2025年 文本生成视频(未全面开放) 短视频创作、影视预演 ✅ 视频

2. 开源模型

模型名称 类型 发布时间 核心能力与参数 典型应用场景 多模态支持
gpt-oss-120b 推理生产级 2025年8月 117B参数(MoE),128K上下文 企业级推理、工具链调用 🟡 有限支持
gpt-oss-20b 轻量本地化 2025年8月 21B参数(MoE),消费级设备可部署 边缘计算、专用场景推理 🟡 有限支持
Whisper 语音识别 2022年 多语言转录与翻译 会议记录、字幕生成 ✅ 音频
相关推荐
Pkmer5 小时前
为基于LLM应用开发而生的LangChain框架
langchain·llm
七七powerful6 小时前
AI实战--从零构建的「微舆」:一个多智能体舆情分析系统的架构解析与实践指南
架构·llm·微舆·bettafish
tzy23310 小时前
AI 对话的流式输出详解——不止于SSE
javascript·ai·llm·sse·readablestream
张宇宙10 小时前
MLX-Qwopus3.5-9B 在 oMLX 中无法识别图片的排查与解决
llm
iiiiii1113 小时前
【论文阅读笔记】ReVal:让大模型强化学习真正支持离策略(off-policy)数据复用
论文阅读·笔记·语言模型·大模型·llm
熊猫钓鱼>_>1 天前
从“流程固化“到“意图驱动“:大模型调智能体调Skill架构深度解析
ai·架构·大模型·llm·agent·skill·openclaw
Baihai_IDP1 天前
微软多模态推理模型 Phi-4-reasoning-vision 训练经验分享
人工智能·面试·llm
Pitayafruit1 天前
Windows 也能跑 Hermes Agent!完整安装教程 + 飞书接入,全程避坑
人工智能·llm·agent
深度学习机器1 天前
一文快速看懂Hermes Agent
llm·agent