gpt-oss-120b 是 OpenAI 于 2025 年 8 月发布的开放权重(Open Weight)大语言模型,也是 GPT-2 之后 OpenAI 首次公开发布权重的旗舰级模型。
核心参数
| 项目 | gpt-oss-120b |
|---|---|
| 总参数量 | 117B~120B |
| 激活参数 | 5.1B(MoE) |
| 架构 | Mixture of Experts (MoE) |
| 上下文长度 | 131,072 Tokens |
| 最大输出 | 65,536 Tokens |
| 许可证 | Apache 2.0 |
| 推理需求 | 单张 80GB H100 可运行 |
| 功能 | Tool Calling、Web Search、Python、Structured Output |
性能定位
OpenAI 官方称其在许多推理、数学、代码和 Agent 基准测试中接近甚至达到 OpenAI o4-mini 的水平。
Groq 官方给出的部分指标:
- MMLU:90.0%
- SWE-Bench Verified:62.4%
- MMMLU:81.3%
- HealthBench:57.6%
适合什么场景
- AI Agent
- LangGraph / LangChain
- RAG
- Function Calling
- 自动化工作流
- 代码生成
- 数学推理
- 本地部署(高端服务器)
在 Groq 中调用
from langchain_groq import ChatGroq
llm = ChatGroq(
model="openai/gpt-oss-120b",
temperature=0
)
或者直接调用 Groq SDK:
from groq import Groq
client = Groq()
response = client.chat.completions.create(
model="openai/gpt-oss-120b",
messages=[
{"role": "user", "content": "Explain RAG"}
]
)
与常见模型对比
| 模型 | 特点 |
|---|---|
| gpt-oss-20b | 更轻量,可在 16GB 内存设备运行 |
| gpt-oss-120b | 开源模型中的旗舰版本 |
| DeepSeek-R1 | 推理能力强,本地部署热门 |
| Qwen3 | 中文能力突出 |
| Claude Opus 4 | 闭源,长文本和编程能力强 |
| GPT-5 | 闭源旗舰模型 |
如果你是在学习 LangGraph、Agent 或 RAG,那么目前(2026 年)openai/gpt-oss-120b 是 Groq 上性价比非常高的 Agent 模型之一:支持工具调用、速度快(Groq 可达数百 Tokens/s)、成本远低于闭源旗舰模型。