OpenAI 模型命名(GPT-5)

一、OpenAI模型命名规则解析

OpenAI的命名体系通过基础名称+版本号+功能后缀的组合反映模型定位,具体规则如下:

  1. 主版本号(如GPT-3/4/5)

    • 数字越大代表技术代际越新,核心架构升级(如GPT-4支持多模态,GPT-5统一产品线)。
  2. 字母后缀

    • o:代表"omni"(全能),支持多模态输入输出(如GPT-4o支持文本、图像、音频)。
    • oss:开源模型标识(如gpt-oss-120b)。
  3. 性能后缀

    • Turbo:响应速度优化版(如GPT-3.5 Turbo)。
    • Pro:增强性能版(如o1-pro)。
    • mini:轻量级版本,资源占用低(如o4-mini)。
  4. 专用系列

    • O系列:专注逻辑推理与工具调用(如O3、O4-mini)。
    • DALL·E/Sora:图像/视频生成专用模型。

二、常见模型清单与对比

1. 商业闭源模型

模型名称 类型 发布时间 核心能力与参数 典型应用场景 多模态支持
GPT-5 全能多模态 2024年8月 文本/图像/音频/视频交互,400K上下文 跨媒体创作、实时会议纪要 ✅ 全支持
GPT-4o 全能多模态 2024年5月 文本/图像/音频/视频交互,128K上下文 跨媒体创作、实时会议纪要 ✅ 全支持
GPT-4.5 文本优化 2025年2月 情感表达优化,32K上下文 社交媒体文案、客户沟通
o3 推理旗舰 2025年4月 复杂逻辑推理,工具调用,视觉推理 科研分析、商业决策 🟡 有限支持
o4-mini 轻量推理 2025年4月 200K上下文,低成本高吞吐 数据清洗、编程辅助
GPT-4.1 长文本处理 2025年4月 100万Token上下文,精准指令执行 法律合同分析、金融文档审核
DALL·E 3 图像生成 2024年 高分辨率图像生成与编辑 创意设计、营销素材生成 ✅ 图像
Sora 视频生成 2025年 文本生成视频(未全面开放) 短视频创作、影视预演 ✅ 视频

2. 开源模型

模型名称 类型 发布时间 核心能力与参数 典型应用场景 多模态支持
gpt-oss-120b 推理生产级 2025年8月 117B参数(MoE),128K上下文 企业级推理、工具链调用 🟡 有限支持
gpt-oss-20b 轻量本地化 2025年8月 21B参数(MoE),消费级设备可部署 边缘计算、专用场景推理 🟡 有限支持
Whisper 语音识别 2022年 多语言转录与翻译 会议记录、字幕生成 ✅ 音频
相关推荐
dawdo22217 小时前
自己动手从头开始编写LLM推理引擎(9)-KV缓存实现和优化
缓存·llm·transformer·qwen·kv cache
小杨互联网1 天前
LLM应用三大隐形风险与防护方案详解
llm
小汤圆不甜不要钱1 天前
「Datawhale」RAG技术全栈指南 Task 5
python·llm·rag
五点钟科技2 天前
Deepseek-OCR:《DeepSeek-OCR: Contexts Optical Compression》 论文要点解读
人工智能·llm·ocr·论文·大语言模型·deepseek·deepseek-ocr
AndrewHZ2 天前
【AI黑话日日新】什么是AI智能体?
人工智能·算法·语言模型·大模型·llm·ai智能体
山顶夕景2 天前
【LLM】多模态智能体Kimi-K2.5模型
llm·agent·多模态
JTnnnnn2 天前
【架構優化】拒絕 LLM 幻覺:設計基於 Python 路由的 AntV 智慧圖表生成系統
llm·antv·dify
AndrewHZ2 天前
【AI黑话日日新】什么是skills?
语言模型·大模型·llm·claude code·skills
国家一级假勤奋大学生2 天前
InternVL系列 technical report 解析
大模型·llm·vlm·mllm·internvl·调研笔记
缘友一世2 天前
张量并行和流水线并行原理深入理解与思考
学习·llm·pp·tp