【新模型速递】PAI-Model Gallery云上一键部署gpt-oss系列模型

阿里云大数据AI技术2025-08-12 14:11

模型介绍

近期，OpenAI 开源了 gpt-oss 系列模型，包含2个尺寸，gpt-oss-120b 和 gpt-oss-20b。

gpt-oss-120b 适用于生产环境、通用目的、高推理需求（117B 参数，5.1B 激活参数）
gpt-oss-20b 适用于低延迟、本地或特定用途（21B 参数，3.6B 激活参数）

本次开源使用了宽松的 Apache 2.0 License，非常适合实验、定制和商业部署。

阿里云 PAI-Model Gallery 已同步接入 gpt-oss 系列模型，提供企业级部署方案。

PAI-Model Gallery 简介

PAI-Model Gallery 是阿里云人工智能平台 PAI 的产品组件，它集成了国内外 AI 开源社区中优质的预训练模型，涵盖了 LLM、AIGC、CV、NLP 等各个领域。通过 PAI 对这些模型的适配，用户可以以零代码方式实现从训练到部署再到推理的全过程，简化了模型的开发流程，为开发者和企业用户带来了更快、更高效、更便捷的 AI 开发和应用体验。

PAI-Model Gallery 访问地址：pai.console.aliyun.com/#/quick-sta...

✅ 零代码一键部署

✅ 自动适配云资源

✅ 部署后开箱即用API

✅ 全流程运维托管

✅ 企业级安全数据不出域

一键部署 gpt-oss 模型

在 PAI-Model Gallery 模型广场找到 gpt-oss-120b 模型，或通过链接直达该模型：pai.console.aliyun.com/#/quick-sta...

在模型详情页右上角点击「部署」，在选择计算资源后，即可一键完成模型的云上部署。

部署成功后，在服务页面可以点击"查看调用信息"获取调用的 Endpoint 和 Token，想了解服务调用方式可以点击预训练模型链接，返回模型介绍页查看调用方式说明。

使用推理服务：您可以使用 API 调用模型服务，也可以使用 PAI 平台提供的在线调试功能，此外您还可以使用 PAI 平台提供的 WebUI 界面与模型进行交互。

更多模型支持

PAI-Model Gallery 持续提供开源社区热门模型快速部署、训练、评测实践。

云上一键部署 Qwen3-Coder 模型：mp.weixin.qq.com/s/-ToH329Gz...
云上一键部署 Kimi K2 模型：mp.weixin.qq.com/s/4OFrdAt0c...
云上一键部署 Qwen3 全尺寸模型：mp.weixin.qq.com/s/20xc0g-h6...
DeepSeek-R1 推理性能优化版：mp.weixin.qq.com/s/yMR4CAfW0...。推理性能提升，相同时延约束下，吞吐能提升492%；相同吞吐情况下，首token时延直降86%，token间时延直降69%。

上一篇：香橙派 RK3588 部署千问大模型 Qwen2-VL-2B 推理视频

下一篇：REDIS 各种数据结构有什么作用？都能干什么？

热门推荐

012026 年 AI 编程工具终极横评：Cursor vs Claude Code vs Copilot vs Windsurf 02GitHub 镜像站点 03【AI】2026 年具身智能模型和世界模型总结 042026年6月AI大模型全景报告：GPT-5.6、Claude Opus 4.8、Gemini 3.5，中美AI三足鼎立谁主沉浮？052026 AI 编程工具终极实战指南：Cursor vs Claude Code vs Copilot，开发者该怎么选？06Claude Code、Codex、Cursor三分天下：2026年AI编程Agent生态全景剖析 072026 年 AI 大模型 & AI 编程工具实战全总结 082026年6月AI行业全景：从百模大战到Agent元年，这30天发生了什么？09AI科技热点日报 | 2026年07月01日 10Trae国际版与国内版深度测评：AI原生IDE的双生花