OpenAI 模型命名(GPT-5)

一、OpenAI模型命名规则解析

OpenAI的命名体系通过基础名称+版本号+功能后缀的组合反映模型定位,具体规则如下:

  1. 主版本号(如GPT-3/4/5)

    • 数字越大代表技术代际越新,核心架构升级(如GPT-4支持多模态,GPT-5统一产品线)。
  2. 字母后缀

    • o:代表"omni"(全能),支持多模态输入输出(如GPT-4o支持文本、图像、音频)。
    • oss:开源模型标识(如gpt-oss-120b)。
  3. 性能后缀

    • Turbo:响应速度优化版(如GPT-3.5 Turbo)。
    • Pro:增强性能版(如o1-pro)。
    • mini:轻量级版本,资源占用低(如o4-mini)。
  4. 专用系列

    • O系列:专注逻辑推理与工具调用(如O3、O4-mini)。
    • DALL·E/Sora:图像/视频生成专用模型。

二、常见模型清单与对比

1. 商业闭源模型

模型名称 类型 发布时间 核心能力与参数 典型应用场景 多模态支持
GPT-5 全能多模态 2024年8月 文本/图像/音频/视频交互,400K上下文 跨媒体创作、实时会议纪要 ✅ 全支持
GPT-4o 全能多模态 2024年5月 文本/图像/音频/视频交互,128K上下文 跨媒体创作、实时会议纪要 ✅ 全支持
GPT-4.5 文本优化 2025年2月 情感表达优化,32K上下文 社交媒体文案、客户沟通
o3 推理旗舰 2025年4月 复杂逻辑推理,工具调用,视觉推理 科研分析、商业决策 🟡 有限支持
o4-mini 轻量推理 2025年4月 200K上下文,低成本高吞吐 数据清洗、编程辅助
GPT-4.1 长文本处理 2025年4月 100万Token上下文,精准指令执行 法律合同分析、金融文档审核
DALL·E 3 图像生成 2024年 高分辨率图像生成与编辑 创意设计、营销素材生成 ✅ 图像
Sora 视频生成 2025年 文本生成视频(未全面开放) 短视频创作、影视预演 ✅ 视频

2. 开源模型

模型名称 类型 发布时间 核心能力与参数 典型应用场景 多模态支持
gpt-oss-120b 推理生产级 2025年8月 117B参数(MoE),128K上下文 企业级推理、工具链调用 🟡 有限支持
gpt-oss-20b 轻量本地化 2025年8月 21B参数(MoE),消费级设备可部署 边缘计算、专用场景推理 🟡 有限支持
Whisper 语音识别 2022年 多语言转录与翻译 会议记录、字幕生成 ✅ 音频
相关推荐
harykali6 小时前
Datawhale Hello-ROCm学习:初探Gemma4 #AMDev #Datawhale
人工智能·llm
SkySeraph6 小时前
AI-Coding:2026世界杯实时看板
llm·ai-coding
qcx238 小时前
提示工程已死,指令架构永生:深度复盘 GPT-5.5 与 Claude 4.7 带来的范式转移
人工智能·ai·llm·agent·agi·harness
玉鸯21 小时前
Claude Fable 5 下架背后的真正问题:越狱是每个大模型的阿喀琉斯之踵
llm
砍光二叉树1 天前
一文打通 AI 认知:LLM、Agent、MCP、Skill 完整体系
人工智能·llm·agent·skill·mcp
沐自礼1 天前
图像伪造识别和定位
人工智能·llm
XLYcmy1 天前
一个基于 Python 的轻量级 LLM(大语言模型)API 客户端程序:从API交互到LLM应用架构
服务器·python·ai·llm·prompt·agent·token
智泊AI1 天前
一文讲透 LLM 真实运行内核,这篇长文值得逐字细读!
llm
枫子有风1 天前
LLM-RAG(大厂面试常问问题)
面试·职场和发展·llm·rag
冬奇Lab2 天前
Agent 系列(19):Harness 完整体系——8 层防护框架全景
人工智能·llm·agent