OpenAI推出开源GPT-oss-120b与GPT-oss-20b突破性大模型，支持商用与灵活部署！

模型介绍

OpenAI 再次推出开源模型，发布了两款突破性的GPT-oss系列大模型 ，即GPT-oss-120b 和GPT-oss-20b ，为AI领域带来了巨大的创新和发展潜力。这两款模型不仅在性能上与现有的闭源模型媲美，而且在硬件适配性上具有明显优势，为开发者和企业提供了新的应用场景和商业机会。

一、两款模型的参数与性能特点

OpenAI这次开源的两款大模型各有特色，针对不同硬件配置和应用需求提供了解决方案。

模型	参数量	架构	激活参数量	性能特点	硬件要求
GPT-oss-120b	1170亿	MoE（专家混合）架构	51亿	- 在Codeforces竞赛编程和MMLU通用知识测试中超越o3-mini	- 单张80GB H100 GPU上运行，甚至高端游戏本可基本运行
				- 在医疗健康（HealthBench）和竞赛数学（AIME 2025）领域表现优于闭源的o4-mini
GPT-oss-20b	210亿	常规架构	36亿	- 在M3 Pro芯片的MacBook Pro上，以23.72 token/秒生成贪吃蛇游戏代码，性能接近o3-mini	- 仅需16GB内存设备即可驱动，适用于MacBook Pro、新款安卓手机等低配置设备

通过采用MoE架构，OpenAI成功实现了"参数规模 "与"运行效率"的平衡，拓展了大模型的应用场景。

二、Apache 2.0 许可：商用与修改的宽松条件

与模型性能同样值得关注的是开源许可条款。此次发布的两款模型均采用Apache 2.0许可证 ，这意味着企业可以自由商用、修改代码并进行二次分发，无需公开修改后的源代码。相比Meta的Llama 3（限制非商业使用），Apache 2.0许可为企业商用提供了更为宽松的条件。不过需要注意的是，模型的训练数据并未公开，尽管如此，开发者仍可基于现有模型进行微调与部署。

三、生态支持：多方合作助力推广

为进一步推广开源模型，OpenAI已与多个技术合作伙伴达成合作，推动模型应用的广泛部署。

合作伙伴：Azure、AWS、Hugging Face、Ollama、NVIDIA等20多家企业。
模型下载与部署：开发者可以通过Hugging Face

下载模型权重，并在Ollama 进行本地部署；微软还推出了Windows GPU优化版 ，支持AMD 和苹果M系列芯片的原生运行。
离线能力：即使在断网环境下，模型仍能调用本地工具（如Python解释器）进行任务生成、数据运算等操作。

四、存在的争议：幻觉率与安全风险

尽管GPT-oss系列模型在硬件适配和性能上表现出色，但仍存在一些问题需要改进。

幻觉率问题：在PersonQA

测试中，120b模型的错误信息比例高达49%，是o1模型的三倍，这对医疗、法律等要求高精度的场景来说是一个潜在的挑战。
安全风险：由于Apache 2.0

的商用权限较宽松，可能会被滥用于生成垃圾信息或恶意代码。OpenAI表示已经进行过多轮安全测试，但仍无法完全避免滥用情况的发生。

尽管如此，这一开源举措无疑为AI行业注入了新的活力，打破了部分AI技术的垄断格局，促进了技术的快速发展。

结语：为开发者与企业提供更多选择

对于开发者而言，GPT-oss-20b 模型可以帮助打造本地AI助手，提升工作效率；对于企业，GPT-oss-120b模型则为构建专属大模型提供了可行的解决方案。这两款模型为不同需求的用户提供了新的选择和机遇，推动AI领域向更广泛的应用场景发展。

详细信息与技术资源请访问：

GitHub 地址：https://github.com/openai/gpt-oss

hugging face 地址：https://huggingface.co/openai/gpt-oss-20b

hugging face 地址：https://huggingface.co/openai/gpt-oss-120b

modelscope地址：https://modelscope.cn/models/openai-mirror/gpt-oss-20b/summary

modelscope地址：https://modelscope.cn/models/openai-mirror/gpt-oss-120b/summary

ollama 可视化下载模型方法

Ollama 与 OpenAI 合作，将其最新的先进开放权重模型引入 Ollama。20B和120B这两个模型带来 了全新的本地聊天体验，专为强大的推理能力、代理任务和多样化的开发者用例而设计。

功能亮点

Agentic 功能：

使用模型的原生功能进行函数调用、网页浏览（Ollama 提供内置网页搜索，可以选择启用该功能以使用最新信息扩充模型）、python 工具调用和结构化输出。
完整的思路：

完全访问模型的推理过程，从而更轻松地进行调试并增强对输出的信任。
可配置的推理力度：

根据您的具体用例和延迟需求轻松调整推理力度（低、中、高）。
可微调：

通过参数微调完全根据您的特定用例定制模型。
宽松的 Apache 2.0 许可证：

自由构建，不受版权限制或专利风险 - 非常适合实验、定制和商业部署。

量化 - MXFP4 格式

OpenAI 利用量化技术来减少 gpt-oss 模型的内存占用。这些模型在训练后会将混合专家 (MoE) 权重量化为 MXFP4 格式，其中每个参数的权重被量化为 4.25 位。MoE 权重占总参数数量的 90% 以上，将这些权重量化为 MXFP4 格式后，较小的模型可以在内存低至 16GB 的系统上运行，而较大的模型则可以在单个 80GB 的 GPU 上运行。

Ollama 原生支持 MXFP4 格式，无需额外量化或转换。Ollama 的新引擎已开发新内核，以支持 MXFP4 格式。

Ollama 与 OpenAI 合作，根据他们的参考实现进行基准测试，以确保 Ollama 的实现具有相同的质量。

20B参数模型