【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Next系列模型

模型介绍

阿里巴巴最新开源了下一代基础模型 Qwen3-Next ,重点是通过创新的模型架构提高扩展效率。Qwen3-Next-80B-A3B 是 Qwen3-Next 系列的第一个版本,具有以下关键增强功能:

  • 混合注意力 :将标准注意力替换为 Gated DeltaNetGated Attention 的组合,从而实现超长上下文长度的有效上下文建模。

  • 高稀疏度混合专家(MoE):在 MoE 层中实现了极低的激活比率,大幅减少了每个令牌的 FLOPs,同时保持了模型容量。

  • 稳定性优化 :包括 零中心化和权重衰减层归一化 等技术,以及其他稳定增强措施,以实现稳健的预训练和后训练。

  • 多令牌预测(MTP):提升预训练模型性能并加速推理。

在参数效率和推理速度方面 Qwen3-Next-80B-A3B 都有强劲表现:

  • Qwen3-Next-80B-A3B-Base 在下游任务上的表现优于 Qwen3-32B-Base,总训练成本仅为 10%,并且在超过 32K 令牌的上下文中推理吞吐量提高了 10 倍。

  • Qwen3-Next-80B-A3B-Instruct 在某些基准测试中的表现与 Qwen3-235B-A22B-Instruct-2507 相当,而在处理高达 256K 令牌的超长上下文任务时表现出显著优势。

阿里云 PAI-Model Gallery 已同步接入 Qwen3-Next 系列模型,提供企业级部署方案。

PAI-Model Gallery 是阿里云人工智能平台 PAI 的产品组件,它集成了国内外 AI 开源社区中优质的预训练模型,涵盖了 LLM、AIGC、CV、NLP 等各个领域。通过 PAI 对这些模型的适配,用户可以以零代码方式实现从训练到部署再到推理的全过程,简化了模型的开发流程,为开发者和企业用户带来了更快、更高效、更便捷的 AI 开发和应用体验。

PAI-Model Gallery 访问地址:pai.console.aliyun.com/#/quick-sta...

✅ 零代码一键部署

✅ 自动适配云资源

✅ 部署后开箱即用API

✅ 全流程运维托管

✅ 企业级安全 数据不出域

一键部署 Qwen3-Next 模型

  1. 在 PAI-Model Gallery 模型广场找到 Qwen3-Next-80B-A3B-Instruct 模型,或通过链接直达该模型:pai.console.aliyun.com/#/quick-sta...
  1. 在模型详情页右上角点击「部署」,平台支持SGLang、vLLM部署框架,并支持MTP(Multi-Token Prediction)来加速推理性能,同时支持修改TP(张量并行)、DP(数据并行)、EP(专家并行)等参数。平台已提供默认配置,只需选择计算资源,即可一键完成模型的云上部署。

3. 部署成功后,在服务页面可以点击"查看调用信息"获取调用的 Endpoint 和 Token,想了解服务调用方式可以点击预训练模型链接,返回模型介绍页查看调用方式说明。

  1. 使用推理服务:您可以使用 API 调用模型服务,也可以使用 PAI 平台提供的在线调试功能,此外您还可以使用 PAI 平台提供的 WebUI 界面与模型进行交互。可以看到,Qwen3-Next-80B-A3B-Instruct 仅支持指令(非思考)模式,并且在其输出中不会生成 块。

更多模型支持

PAI-Model Gallery 持续提供开源社区热门模型快速部署、训练、评测实践。

相关推荐
BioRunYiXue7 分钟前
Nature Methods:CellVoyager 自主 AI 智能体开启生物数据分析新时代
大数据·开发语言·前端·javascript·人工智能·数据挖掘·数据分析
模拟器连接器曾工17 分钟前
PLC视觉检测原理有哪些?
人工智能·计算机视觉·视觉检测·plc视觉检测
饼干哥哥20 分钟前
5w的独立站开发需求,我用Kimi K2.5 一键就生成好了
人工智能
QC·Rex22 分钟前
AI Agent 任务规划实战:从 ReAct 到 Plan-and-Solve 的完整指南
人工智能·python·react
roman_日积跬步-终至千里37 分钟前
【强化学习】01-概念全景:怎么“看懂”MC、TD 和 Q-learning
人工智能
智算菩萨38 分钟前
【论文精读】通过元学习与关联规则挖掘增强人工智能在网络安全领域特征选择中的可解释性
论文阅读·人工智能·学习·web安全·论文笔记
AI创界者1 小时前
零门槛部署!MOSS-TTS 语音合成与音色克隆本地整合包发布(支持 API/低显存)
人工智能
IT 行者1 小时前
LangChain4j 集成 Redis 向量存储:我踩过的坑和选型建议
java·人工智能·redis·后端
YuanDaima20481 小时前
LangChain基础配置与对话模型实战
人工智能·python·langchain·大模型·智能体·langgraph
团子和二花1 小时前
Mem0:给 AI Agent 装上「长期记忆」
人工智能