openai/gpt-oss-120b

Esaka_Forever2026-06-16 9:06

gpt-oss-120b 是 OpenAI 于 2025 年 8 月发布的开放权重（Open Weight）大语言模型，也是 GPT-2 之后 OpenAI 首次公开发布权重的旗舰级模型。

核心参数

项目	gpt-oss-120b
总参数量	117B～120B
激活参数	5.1B（MoE）
架构	Mixture of Experts (MoE)
上下文长度	131,072 Tokens
最大输出	65,536 Tokens
许可证	Apache 2.0
推理需求	单张 80GB H100 可运行
功能	Tool Calling、Web Search、Python、Structured Output

性能定位

OpenAI 官方称其在许多推理、数学、代码和 Agent 基准测试中接近甚至达到 OpenAI o4-mini 的水平。

Groq 官方给出的部分指标：

MMLU：90.0%
SWE-Bench Verified：62.4%
MMMLU：81.3%
HealthBench：57.6%

适合什么场景

AI Agent
LangGraph / LangChain
RAG
Function Calling
自动化工作流
代码生成
数学推理
本地部署（高端服务器）

在 Groq 中调用

复制代码

from langchain_groq import ChatGroq

llm = ChatGroq(
    model="openai/gpt-oss-120b",
    temperature=0
)

或者直接调用 Groq SDK：

复制代码

from groq import Groq

client = Groq()

response = client.chat.completions.create(
    model="openai/gpt-oss-120b",
    messages=[
        {"role": "user", "content": "Explain RAG"}
    ]
)

与常见模型对比

模型	特点
gpt-oss-20b	更轻量，可在 16GB 内存设备运行
gpt-oss-120b	开源模型中的旗舰版本
DeepSeek-R1	推理能力强，本地部署热门
Qwen3	中文能力突出
Claude Opus 4	闭源，长文本和编程能力强
GPT-5	闭源旗舰模型

如果你是在学习 LangGraph、Agent 或 RAG，那么目前（2026 年）openai/gpt-oss-120b 是 Groq 上性价比非常高的 Agent 模型之一：支持工具调用、速度快（Groq 可达数百 Tokens/s）、成本远低于闭源旗舰模型。