OpenAI 模型命名(GPT-5)

一、OpenAI模型命名规则解析

OpenAI的命名体系通过基础名称+版本号+功能后缀的组合反映模型定位,具体规则如下:

  1. 主版本号(如GPT-3/4/5)

    • 数字越大代表技术代际越新,核心架构升级(如GPT-4支持多模态,GPT-5统一产品线)。
  2. 字母后缀

    • o:代表"omni"(全能),支持多模态输入输出(如GPT-4o支持文本、图像、音频)。
    • oss:开源模型标识(如gpt-oss-120b)。
  3. 性能后缀

    • Turbo:响应速度优化版(如GPT-3.5 Turbo)。
    • Pro:增强性能版(如o1-pro)。
    • mini:轻量级版本,资源占用低(如o4-mini)。
  4. 专用系列

    • O系列:专注逻辑推理与工具调用(如O3、O4-mini)。
    • DALL·E/Sora:图像/视频生成专用模型。

二、常见模型清单与对比

1. 商业闭源模型

模型名称 类型 发布时间 核心能力与参数 典型应用场景 多模态支持
GPT-5 全能多模态 2024年8月 文本/图像/音频/视频交互,400K上下文 跨媒体创作、实时会议纪要 ✅ 全支持
GPT-4o 全能多模态 2024年5月 文本/图像/音频/视频交互,128K上下文 跨媒体创作、实时会议纪要 ✅ 全支持
GPT-4.5 文本优化 2025年2月 情感表达优化,32K上下文 社交媒体文案、客户沟通
o3 推理旗舰 2025年4月 复杂逻辑推理,工具调用,视觉推理 科研分析、商业决策 🟡 有限支持
o4-mini 轻量推理 2025年4月 200K上下文,低成本高吞吐 数据清洗、编程辅助
GPT-4.1 长文本处理 2025年4月 100万Token上下文,精准指令执行 法律合同分析、金融文档审核
DALL·E 3 图像生成 2024年 高分辨率图像生成与编辑 创意设计、营销素材生成 ✅ 图像
Sora 视频生成 2025年 文本生成视频(未全面开放) 短视频创作、影视预演 ✅ 视频

2. 开源模型

模型名称 类型 发布时间 核心能力与参数 典型应用场景 多模态支持
gpt-oss-120b 推理生产级 2025年8月 117B参数(MoE),128K上下文 企业级推理、工具链调用 🟡 有限支持
gpt-oss-20b 轻量本地化 2025年8月 21B参数(MoE),消费级设备可部署 边缘计算、专用场景推理 🟡 有限支持
Whisper 语音识别 2022年 多语言转录与翻译 会议记录、字幕生成 ✅ 音频
相关推荐
Irissgwe14 小时前
LangChain之核心组件(输出解析器)
ai·langchain·llm·ai编程·输出解析器
阿里云大数据AI技术16 小时前
Qwen3.6、Kimi-K2.6、Minimax-M2.7、GLM-5.1 来啦!PAI支持海量模型一键部署!
人工智能·llm
Irissgwe19 小时前
LangChain之核心组件(少样本提示词)
人工智能·langchain·llm·langgraph
litble20 小时前
如何速成LLM以伪装成一个AI研究者(4)——PPO,GRPO,DAPO,GSPO
人工智能·llm·ppo·grpo·gspo·dapo
强殖装甲凯普20 小时前
我把「3小时播客变成可搜索文本」做成了 Claude Code 的一条命令
llm·skill·播客·claude code
Baihai IDP21 小时前
为什么 AI Agent 重新爱上了文件系统(Filesystems)
人工智能·ai·llm·agi
雪碧聊技术1 天前
一文讲透AI大模型相关的专业名词
llm·token
山顶夕景1 天前
【多模态RAG】Purifying Multimodal Retrieval
大模型·llm·mllm·多模态rag
swipe2 天前
别再把 AI 聊天做成纯文本:从 agui 这个前后端项目,拆解“可感知工具调用”的流式 AI UI
后端·langchain·llm
TheRouter2 天前
Agent Harness系列(三):记忆层的3种持久化架构——从SQLite到向量库
人工智能·架构·sqlite·llm·ai-native