【新模型速递】PAI-Model Gallery云上一键部署Kimi K2模型

近日,月之暗面正式发布Kimi K2 模型 ,并同步开源。Kimi K2 是一款具备更强代码能力 、更擅长通用 Agent 任务的 MoE 架构基础模型,总参数 1T,激活参数 32B。

在自主编程(Agentic Coding)、工具调用(Tool Use)和数学推理(Math & Reasoning)三大能力维度的多个基准性能测试中,Kimi K2 均取得开源模型中的 SOTA 成绩,展现出在代码、Agent、数学推理任务上的领先能力。Kimi K2 的预训练阶段使用 MuonClip 优化器实现万亿参数模型的稳定高效训练,在人类高质量数据成为瓶颈的背景下,有效提高 Token 利用效率,找到新的 Scaling 空间。

由于Kimi K2 模型的参数量达 1000B,需要至少2节点896G或1节点1696G显存的计算资源进行推理,云端部署成为企业用户和开发者们部署 Kimi K2 时的优先选择。阿里云 PAI-Model Gallery 已同步接入 Kimi K2 模型,提供企业级部署方案。

PAI-Model Gallery 是阿里云人工智能平台 PAI 的产品组件,它集成了国内外 AI 开源社区中优质的预训练模型,涵盖了 LLM、AIGC、CV、NLP 等各个领域。通过 PAI 对这些模型的适配,用户可以以零代码方式实现从训练到部署再到推理的全过程,简化了模型的开发流程,为开发者和企业用户带来了更快、更高效、更便捷的 AI 开发和应用体验。

PAI-Model Gallery 访问地址:x.sm.cn/EmVCdiF

✅ 零代码一键部署

✅ 自动适配云资源

✅ 部署后开箱即用 API

✅ 全流程运维托管

✅ 企业级安全 数据不出域

一键部署 Kimi K2

  1. 登录阿里云,并前往阿里云人工智能平台PAI 工作空间,在左侧导航栏选择 ModelGallery

  2. PAI-Model Gallery 模型广场找到 Kimi K2 模型,或通过链接直达该模型:pai.console.aliyun.com/?regionId=c...

  3. 在模型详情页右上角点击「部署」,在选择计算资源后,即可一键完成模型的云上部署。

  4. 部署成功后,在服务页面可以点击"查看调用信息"获取调用的 Endpoint 和 Token,想了解服务调用方式可以点击预训练模型链接,返回 Kimi K2 模型介绍页查看调用方式说明。

  5. 使用推理服务:您可以使用 API 调用模型服务,也可以使用 PAI 平台提供的在线调试功能,此外您还可以使用 PAI 平台提供的 WebUI 界面与模型进行交互。

更多模型支持

PAI-Model Gallery 持续提供开源社区热门模型快速部署、训练、评测实践。

  • 云上一键部署 Qwen3 全尺寸模型:

x.sm.cn/CkUt7rk

相关推荐
livemetee6 分钟前
Flink2.0学习笔记:Flink服务器搭建与flink作业提交
大数据·笔记·学习·flink
aneasystone本尊19 分钟前
学习 Coze Studio 的工作流执行逻辑
人工智能
aneasystone本尊27 分钟前
再学 Coze Studio 的智能体执行逻辑
人工智能
xuanwuziyou29 分钟前
LangChain 多任务应用开发
人工智能·langchain
新智元1 小时前
一句话,性能暴涨 49%!马里兰 MIT 等力作:Prompt 才是大模型终极武器
人工智能·openai
猫头虎1 小时前
猫头虎AI分享|一款Coze、Dify类开源AI应用超级智能体Agent快速构建工具:FastbuildAI
人工智能·开源·github·aigc·ai编程·ai写作·ai-native
新智元1 小时前
AI 版华尔街之狼!o3-mini 靠「神之押注」狂赚 9 倍,DeepSeek R1 最特立独行
人工智能·openai
天下弈星~1 小时前
GANs生成对抗网络生成手写数字的Pytorch实现
人工智能·pytorch·深度学习·神经网络·生成对抗网络·gans
重启的码农2 小时前
ggml介绍 (8) 图分配器 (ggml_gallocr)
c++·人工智能·神经网络
重启的码农2 小时前
ggml介绍 (9) 后端调度器 (ggml_backend_sched)
c++·人工智能·神经网络