PAI支持一键部署GLM-5.2,Coding能力比肩Claude Opus 4.8

模型介绍

近日,智谱全新开源 GLM-5.2!PAI 平台现已支持 GLM-5.2 模型,一键即可部署调用!

GLM-5.2 支持1M 无损上下文, 在长程任务中保持领先,多个长程任务基准均为开源最强模型;提供更强体感、更实用的 Coding 能力 ,在主流编程基准上,GLM-5.2 保持开源 SOTA,与 Claude Opus 4.8 处于可比区间 ;通过模型架构、推理系统和训练基础设施的协同设计,带来极致 Infra 优化。

在全球百万用户参与盲测的前端开发评估系统 Code Arena 上,GLM-5.2 取得全球可用模型第一的表现。

除 GLM-5.2 外,PAI-Model Gallery 同样支持 MiniMax M3、Kimi K2.7 Code、Qwen3.6、DeepSeek-V4、GLM-5.1 等前沿模型的一键部署。其中 DeepSeek-V4 支持 Deepseek-V4-Pro 和 Deepseek-V4-Flash 全系列模型,含 FP8/Int8 量化版 ,并可使用真武 810E 高效支持推理需求(DeepSeek-V4-Flash-Int8-W8A8)!

一键部署 GLM-5.2 模型

  1. 在 PAI-Model Gallery 模型广场找到 GLM-5.2 模型,或通过链接直达该模型:
  1. 在模型详情页右上角点击「部署」,选择计算资源后,即可一键完成云上部署。
  • GLM-5.2 支持 vLLM 高性能部署框架 / SGLang 高性能部署框架,支持分布式部署,需 16*GPU 或以上资源;

  • GLM-5.2-FP8 支持 vLLM 高性能部署框架 / SGLang 高性能部署框架,支持单机部署,需 8*GPU 或以上资源;

  1. 部署成功后,在服务页面可以点击"查看调用信息"获取调用的调用地址和 Token,想了解服务调用方式可以点击模型详情页,查看调用方式说明。

Model Gallery 是阿里云人工智能平台 PAI 的产品组件,它集成了国内外 AI 开源社区中优质的预训练模型,涵盖了 LLM、AIGC、CV、NLP 等各个领域。通过 PAI 对这些模型的适配,用户可以以零代码方式实现从训练到部署再到推理的全过程,简化了模型的开发流程,为开发者和企业用户带来了更快、更高效、更便捷的 AI 开发和应用体验。

PAI-Model Gallery 访问地址: pai.console.aliyun.com/#/quick-sta...

阿里云 PAI-Model Gallery 已同步接入 GLM-5.2、Kimi K2.7 Code、MiniMax M3、Kimi K2.7 Code、Qwen3.6-35B-A3B 与 DeepSeek-V4 等最新主流模型,提供企业级部署方案。

✅ 零代码一键部署

✅ 自动适配云资源

✅ 开箱即用API

✅ 全流程运维托管

✅ 企业级安全 数据不出域

更多模型支持

PAI-Model Gallery 持续提供开源社区热门模型的快速部署、微调、蒸馏、评测实践,模型覆盖 Qwen、Wan、DeepSeek、Kimi、MiniMax 等优秀开源模型,同时还提供 Qwen3-235B-A22B-PAI-optimized、Qwen3-Next-80B-A3B-Instruct-FP8-PAI-optimized、DeepSeek-R1-0528-PAI-optimized 等 PAI 优化版本模型,内置了 PAI 优化版的 EP+PD 分离部署等模板,性能更优。

相关推荐
吾鳴1 小时前
腾讯版贾维斯(Marvis),用过就回不去了
人工智能
黄啊码1 小时前
【黄啊码】都是循环,workflow 和 Loop Engineering 有何不同?
人工智能
网易云信2 小时前
9.9 元领 3 亿 Token,这个夏天实现 AI 自由!
人工智能·aigc·产品
网易云信2 小时前
全框架覆盖!网易智企IM鸿蒙生态适配再进一步
人工智能·aigc·harmonyos
字节跳动视频云技术团队2 小时前
从生成到交付,音视频 Agent 要有生产级开发套件
人工智能·音视频开发
网易云信2 小时前
重磅认证!网易智企智能融合通信获鸿蒙生态权威认可,斩获「Harmony Trusted SDK」认证
人工智能·后端·aigc
吴佳浩2 小时前
DeepSeek DSpark:Confidence-Scheduled Speculative Decoding 技术解析
人工智能·算法·deepseek
网易云信3 小时前
网易智企IM Web体验馆:一站式在线体验即时通讯
人工智能·后端·aigc
阿里云大数据AI技术3 小时前
StarRocks x Fluss x Paimon湖流一体方案:构建秒级响应、湖流一体的实时数据引擎
大数据·人工智能