云上一键部署通义千问 QwQ-32B 模型,阿里云 PAI 最佳实践

QwQ-32B 模型简介

3月6日,阿里云发布并开源了全新的推理模型通义千问QwQ-32B。通过大规模强化学习,千问QWQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩Deepseek-R1。在保持强劲性能的同时,千问QwQ-32B还大幅降低了部署使用成本。

在一系列权威基准测试中,千问QwQ-32B模型表现异常出色,几乎完全超越了OpenAI-o1-mini,比肩最强开源推理模型DeepSeek-R1 :在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型;在由Meta首席科学家杨立昆领衔的"最难LLMs评测榜"LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1。此外,千问QwQ-32B模型中还集成了与智能体Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。

Model Gallery 是阿里云人工智能平台 PAI 的产品组件,它集成了国内外 AI 开源社区中优质的预训练模型,涵盖了 LLM、AIGC、CV、NLP 等各个领域。通过 PAI 对这些模型的适配,用户可以以零代码方式实现从训练到部署再到推理的全过程,简化了模型的开发流程,为开发者和企业用户带来了更快、更高效、更便捷的 AI 开发和应用体验。

PAI-Model Gallery 访问地址:x.sm.cn/Hj94lkS

  1. 进入 Model Gallery 页面

链接:x.sm.cn/Hj94lkS

1.1. 登录PAI 控制台

1.2. 在顶部左上角根据实际情况选择地域(当前除北京地域外,都已支持QwQ-32B模型)。

1.3. 在左侧导航栏选择工作空间列表 ,单击指定工作空间名称,进入对应工作空间内。

1.4. 在左侧导航栏选择快速开始 >Model Gallery。

  1. 在 Model Gallery 页面的模型列表中,单击找到并点击QwQ-32B 模型卡片,进入模型详情页面。
  1. 单击右上角部署 ,选择部署框架、配置推理服务名称以及部署使用的资源信息后,即可一键部署服务,将模型部署到PAI-EAS 推理服务平台。当前平台已支持多种部署框架,包括SGLang加速部署、vLLM加速部署、BladeLLM加速部署(阿里云PAI自研高性能推理框架)。
  1. 使用推理服务。部署成功后,在服务页面可以点击**"查看调用信息**"获取调用的Endpoint和Token,想了解服务调用方式可以点击预训练模型链接,返回模型介绍页查看调用方式说明。

您也可以在 PAI-EAS 推理服务平台上在线调试已部署好的QwQ-32B模型服务。从图中可以看出模型回复具备较好的思维链能力。

联系我们

欢迎各位小伙伴持续关注使用 PAI-Model Gallery,平台会不断上线 SOTA 模型,如果您有任何模型需求,也可以联系我们。

您可通过钉钉 扫描下方二维码(或搜索钉钉群号79680024618),加入PAI-Model Gallery用户交流群。

相关推荐
清辞8531 分钟前
入门大模型工程师第十课----学习总结
大数据·人工智能·深度学习·学习·语言模型
zhangfeng11331 分钟前
那nvidia orim车载gpu tee安全飞地 和天垓 100 gpgpu的 飞地 ,大概有多大存储量 ,解密流程
人工智能·深度学习·安全·语言模型·gpu算力·芯片
蔡不菜和他的uU们15 分钟前
vLLM实践之个人AI基建——云端vLLM+SSH Tunnel+本地Cherry Studio
人工智能·ssh·vllm
黄啊码20 分钟前
8个AI,同一道高考作文题,同一个结果:我的那篇最好
人工智能
m0_7372469821 分钟前
QDKT产品拆解&设计
人工智能
xinlianyq24 分钟前
TikTok短视频生成工具哪家好?跨境出海如何用 AI 实现爆款视频复刻
人工智能·aigc
源码宝32 分钟前
基于SpringCloud+UniApp的智慧工地云平台整体架构设计与实现
java·人工智能·spring cloud·源码·智慧工地·云平台
Aousdu33 分钟前
AI_Coding_用python做一个智能编程助手(1)
人工智能
大写-凌祁36 分钟前
RS-Claw & XSkill 深度分析
人工智能·语言模型·云计算·腾讯云·agi
大模型任我行36 分钟前
蚂蚁:无师自通的视觉记忆增强
人工智能·计算机视觉·语言模型·论文笔记