OpenAI开源gpt-oss-safeguard-120b和gpt-oss-safeguard-20b


gpt-oss-safeguard-120bgpt-oss-safeguard-20b是基于gpt-oss构建的安全推理模型。通过这些模型,您可以根据提供的安全策略对文本内容进行分类,并执行一系列基础安全任务。这些模型专为安全用例设计。对于其他应用场景,我们推荐使用gpt-oss系列模型

该型号gpt-oss-safeguard-120b可部署在单块H100 GPU上运行(1170亿参数总量,51亿活跃参数)。若需更低延迟版本,请选用gpt-oss-safeguard-20b(210亿参数总量,36亿活跃参数)。

所有模型均基于我们开发的harmony响应格式进行训练,必须严格遵循harmony格式使用,否则将无法正常工作。

产品亮点

  • 安全推理专项训练:针对安全推理场景进行专项训练与优化,适用于大语言模型输入输出过滤、在线内容标注以及信任与安全场景的离线标注等用例。
  • 自定义策略机制:可解析用户编写的安全策略,无需复杂工程适配即可跨产品和用例通用。
  • 决策过程透明化:提供完整的模型推理过程(注:原始思维链功能面向开发者和安全专业人员设计,不建议向普通用户或在非安全场景使用),不仅输出判定结果,更展现决策依据,便于调试分析并增强对策略决策的信任度。
  • 可调节推理强度:根据具体用例和延迟需求,灵活选择低/中/高三档推理强度。
  • Apache 2.0开源许可:允许自由构建且无著作权限制或专利风险,特别适合实验研究、定制开发和商业部署。

推理示例

gpt-oss-safeguard-120b与gpt-oss-safeguard-20b的使用方式与对应手册中描述的gpt-oss系列模型类似。我们同时提供了详细的提示词指南,说明如何编写安全策略并与模型配合使用。

模型下载

通过Hugging Face平台下载模型权重,操作流程与gpt-oss-120b下载指引类似。

加入ROOST模型社区

gpt-oss-safeguard是稳健开放在线安全工具(ROOST)模型社区的合作伙伴。该社区聚集了致力于运用开源AI模型保护网络空间的安全实践者。作为社区合作伙伴,OpenAI将持续整合用户反馈,与社区共同迭代未来版本以推进开放安全生态。访问RMC GitHub仓库了解合作详情及参与方式。

相关资源

相关推荐
墨染天姬23 分钟前
【AI】端侧AIBOX可以部署哪些智能体
人工智能
AI成长日志28 分钟前
【Agentic RL】1.1 什么是Agentic RL:从传统RL到智能体学习
人工智能·学习·算法
SharpCJ32 分钟前
Android 开发者为什么必须掌握 AI 能力?端侧视角下的技术变革
android·ai·aigc
2501_9481142440 分钟前
2026年大模型API聚合平台技术评测:企业级接入层的治理演进与星链4SAPI架构观察
大数据·人工智能·gpt·架构·claude
小小工匠42 分钟前
LLM - awesome-design-md 从 DESIGN.md 到“可对话的设计系统”:用纯文本驱动 AI 生成一致 UI 的新范式
人工智能·ui
迷藏49443 分钟前
**发散创新:基于Rust实现的开源合规权限管理框架设计与实践**在现代软件架构中,**权限控制(RBAC)** 已成为保障
java·开发语言·python·rust·开源
黎阳之光1 小时前
黎阳之光:视频孪生领跑者,铸就中国数字科技全球竞争力
大数据·人工智能·算法·安全·数字孪生
小超同学你好1 小时前
面向 LLM 的程序设计 6:Tool Calling 的完整生命周期——从定义、决策、执行到观测回注
人工智能·语言模型
墨风如雪1 小时前
玩转本地 AI 的“第 0 步”:Node.js 环境保姆级安装教程
aigc
智星云算力1 小时前
本地GPU与租用GPU混合部署:混合算力架构搭建指南
人工智能·架构·gpu算力·智星云·gpu租用