Qwen3.6、Kimi-K2.6、Minimax-M2.7、GLM-5.1 来啦!PAI支持海量模型一键部署!

模型介绍

近日,开源大模型领域迎来新一轮技术爆发,Kimi-K2.6、Minimax-M2.7、GLM-5.1 与 Qwen3.6-35B-A3B 等前沿模型相继发布。PAI-Model Gallery 已支持云上一键部署上述全部模型,并可使用 真武PPU 高效支持大模型推理需求!

  • Kimi-K2.6 在通用智能、编程能力和视觉理解能力上均展现出了综合竞争力,并且带来其系列模型中迄今最强的代码能力、长程任务执行和Agent集群能力;

  • MiniMax-M2.7 能够自行构建复杂 Agent Harness,并基于 Agent Teams、复杂 Skills、Tool Search Tool 等能力,完成高度复杂的生产力任务;

  • GLM-5.1 在长程自主执行、复杂工程优化与真实开发场景中展现出更强的持续工作能力,能持续、自主地工作长达 8 小时,完成从规划、执行到迭代优化的完整闭环,交付工程级成果;

  • Qwen3.6-35B-A3B 仅激活 3B,轻量高效,而且在智能体编程方面表现卓越,大幅超越前代模型,实现以更低的算力消耗完成更高性能的智能输出。

Model Gallery 是阿里云人工智能平台 PAI 的产品组件,它集成了国内外 AI 开源社区中优质的预训练模型,涵盖了 LLM、AIGC、CV、NLP 等各个领域。通过 PAI 对这些模型的适配,用户可以以零代码方式实现从训练到部署再到推理的全过程,简化了模型的开发流程,为开发者和企业用户带来了更快、更高效、更便捷的 AI 开发和应用体验。

PAI-Model Gallery 访问地址: pai.console.aliyun.com/#/quick-sta...

阿里云 PAI-Model Gallery 已同步接入 DeepSeek-V4、Kimi-K2.6、Minimax-M2.7、GLM-5.1 与 Qwen3.6-35B-A3B 等最新主流模型,提供企业级部署方案。

✅ 零代码一键部署

✅ 自动适配云资源

✅ 开箱即用API

✅ 全流程运维托管

✅ 企业级安全 数据不出域

一键部署最佳实践(以 Qwen3.6-35B-A3B 模型为例)

  1. 在 PAI-Model Gallery 模型广场找到 Qwen3.6-35B-A3B 模型,或通过链接直达该模型:pai.console.aliyun.com/#/quick-sta...

  2. 在模型详情页右上角点击「部署」,平台支持SGLang、vLLM部署框架,提供部署模板,内置默认配置,只需选择计算资源,即可一键完成模型的云上部署,操作十分简便。

  1. 部署成功后,在服务页面可以点击"查看调用信息"获取调用的调用地址Token,想了解服务调用方式可以在模型介绍页查看。

4. 使用推理服务:您可以在本地或使用各类客户端直接调用模型服务,也可以使用 PAI 平台提供的在线调试功能进行在线体验。详情可参考文档:help.aliyun.com/zh/pai/gett...

更多模型支持

PAI-Model Gallery 持续提供开源社区热门模型的快速部署、微调、蒸馏、评测实践,模型覆盖 Qwen、Wan、DeepSeek、Kimi、MiniMax 等优秀开源模型,同时还提供 Qwen3-235B-A22B-PAI-optimized、Qwen3-Next-80B-A3B-Instruct-FP8-PAI-optimized、DeepSeek-R1-0528-PAI-optimized 等 PAI 优化版本模型,内置了 PAI 优化版的 EP+PD 分离部署等模板,性能更优。

联系我们

欢迎各位小伙伴持续关注使用 PAI-Model Gallery,平台会不断上线 SOTA 模型,如果您有任何模型需求,也可以联系我们。您可通过搜索钉钉群号(77450028832),加入 PAI-Model Gallery 用户交流群。

相关推荐
冬奇Lab3 小时前
Agent 系列(23):Web Agent——让 Agent 真正浏览网页
人工智能·llm·agent
冬奇Lab3 小时前
每日一个开源项目(第135篇):codebase-memory-mcp - 给 AI Agent 一张代码库的知识图谱
人工智能·开源·llm
IT_陈寒6 小时前
JavaScript的闭包把我坑惨了,说好的内存会自动回收呢?
前端·人工智能·后端
jooloo9 小时前
Codex 间歇性 400 之谜:一条对话里,它为什么有时候用 chat/completions,有时候切到 responses?
人工智能
用户51914958484510 小时前
OpenSSL PKCS#12 PBMAC1 堆栈缓冲区溢出漏洞 (CVE-2025-11187) 分析与验证
人工智能·aigc
用户51914958484511 小时前
HP Sound Research SECOMNService 权限提升漏洞利用工具
人工智能·aigc
用户0183493016911 小时前
给 AI 智能体能力包一层 BFF,前端只调一个接口
人工智能
黄忠14 小时前
大模型之LangGraph技术体系
python·llm