OpenAI通过两个开源模型GPT-OSS-120B和GPT-OSS-20B重新拥抱开放性

TLDR : OpenAI推出了两个新开源权重语言模型gpt-oss-120B和gpt-oss-20B,这些模型在推理任务上表现出色,并兼容各种应用,包括智能助手。尽管之前存在安全问题,这些模型集成了先进的过滤机制,以最大程度地减少公共使用的风险。
目录

为推理和效率而设计的模型

兼容性和使用案例

安全性和风险评估

对开源的谨慎回归?

OpenAI昨晚宣布推出两个开源权重语言模型,gpt-oss-120B和gpt-oss-20B,并在Apache 2.0许可下提供。这一举措标志着公司的一次重大转变,此前自GPT-2以来,OpenAI一直未提供开源权重的LLM。这些模型的权重在Hugging Face上公开可用。

为推理和效率而设计的模型

这两个模型基于Mixture-of-Experts (MoE)架构,分别拥有1170亿和210亿的参数总量,但每个token只激活其中的一小部分(120B激活5.1B,20B激活3.6B)。两者均支持扩展到128,000个tokens的上下文长度。

OpenAI声称其在推理任务上具有竞争力的性能。GPT-OSS-120B在经典基准测试(如MMLU、HLE、TauBench等)中取得了接近o4-mini的结果,并且可以在单个80GB GPU上运行。较轻的20B模型被宣布可以在16GB内存下工作,这使其有可能在本地或嵌入式设备上使用。

兼容性和使用案例

这些模型与OpenAI的API Responses兼容,并且原生支持Chain-of-Thought (CoT)、函数调用、结构化输出以及根据任务调整推理力度。

OpenAI的目标是将这些模型用于代理工作流程、智能助手开发、研究,或出于安全性或数据主权的原因进行本地部署。像AI Sweden、Orange和Snowflake这样的合作伙伴在发布之前已经参与进来,以探索具体的集成案例。

安全性和风险评估

OpenAI之前因安全问题转向封闭模型。安全性因此成为公司考虑的核心,并导致多次推迟这一备受期待的开源权重模型的发布。OpenAI现在声称已集成先进的过滤和后训练机制,以减少公共使用的风险。尤其是对故意经过恶意微调的版本(网络安全、生物学)进行了由外部专家进行的评估,作为OpenAI准备框架的一部分。

据公司称,即使在这些极端场景下,这些模型也不会达到令人担忧的能力水平。此外,在Kaggle上发起了一项奖金为50万美元的red teaming挑战赛,以鼓励对漏洞的协作检测。

对开源的谨慎回归?

此发布引发了多个问题。一方面,它表明了在强大的专有模型和开源替代方案之间重新平衡供应的意愿。另一方面,它让OpenAI在保持技术领先的同时,通过设定新的开源权重安全标准来规范使用。

在许可宽松的情况下发布权重,提供的工具(如优化推断、harmony renderer、PyTorch和Metal支持等),以及与Azure、Hugging Face或Vercel的合作伙伴关系旨在促进在日益分散的生态系统中的采用。

尚待观察这些模型在何种程度上会被社区采用,特别是面对如Mistral、LLaMA、Mixtral或Yi等替代方案,以及它们的开放性(尤其是自由微调的可能性)是否足以满足研究人员和开发者的期望。

相关推荐
EDPJ2 小时前
(2026|成电,超图,图文融合和对齐,高阶推理/将异常显式地推理为语义-结构一致性的违反)H2VLR:用于少样本异常检测的异构超图视觉语言推理
人工智能·计算机视觉·异常检测
LONGZETECH2 小时前
汽车仿真教学平台支持在线理论考试吗?实操解析+行业案例
人工智能·科技·架构·数据挖掘·汽车·汽车仿真教学软件·新能源汽车仿真教学软件
blackorbird2 小时前
数据投毒Ai训练集行动开始走向社区化作战
人工智能
机器之心2 小时前
蒸馏所有员工:Meta强制收集鼠标键盘输入训练AI,社区炸了
人工智能·openai
阿里云大数据AI技术2 小时前
打造具身智能数据基石:阿里云PAI赋能具身数据高效处理
人工智能·机器人
金融小师妹2 小时前
AI政策框架解析:凯文·沃什货币体系重构与美联储治理范式转型
大数据·人工智能·重构·逻辑回归
旦莫2 小时前
测试工程师如何用AI生成测试用例?我的提示词模板分享
人工智能·python·测试开发·自动化·测试用例·ai测试
UCloud_TShare2 小时前
优刻得发布云搜索服务CSS:面向AI时代的企业级搜索基础设施
前端·css·人工智能
卷积殉铁子2 小时前
从Symphony到AGI宣言,GPT-6的真相比噱头更复杂
人工智能·gpt·chatgpt