MiniMax M3、Kimi K2.7 Code来啦!PAI已支持一键部署,开源前沿触手可及

模型介绍

近日,MiniMax 全新开源 MiniMax M3,月之暗面发布并开源 Kimi K2.7 Code 编程模型!PAI 平台现已支持 MiniMax M3 和 Kimi K2.7 Code 模型,一键即可部署调用!

  • MiniMax M3 是国内首个同时具备原生多模态、超长上下文、Agent 操作 三大能力的开源模型。MiniMax M3 在编码和智能体基准测试中取得了顶尖的性能,具备自主任务分解、工具调用和多步骤推理能力,为 AI 编码助手和自动化工作流程提供了可靠的基础。

在涵盖软件工程、终端执行等方面的权威国际基准测试中,MiniMax M3 均取得了世界领先的性能。

  • Kimi K2.7 Code 是一款以代码能力为核心的智能体模型。该模型在真实场景下的长周期编码任务上实现了显著提升,能够更高效地完成复杂软件工程工作流中的端到端任务,同时提高了 token 利用效率,相比 Kimi K2.6 减少了约 30% 的推理 token 使用量

在多项编程和 Agent 基准测试中,Kimi K2.7 Code 较 K2.6 实现大幅度提升,提升比例从10%-31.5%不等。

除 MiniMax M3、Kimi K2.7 Code 外,PAI-Model Gallery 同样支持 Qwen3.6、DeepSeek-V4、Kimi K2.6、GLM-5.1 等前沿模型的一键部署。其中 DeepSeek-V4 支持 Deepseek-V4-Pro 和 Deepseek-V4-Flash 全系列模型,含 FP8/Int8 量化版 ,并可使用真武 810E 高效支持推理需求(DeepSeek-V4-Flash-Int8-W8A8)!

一键部署 MiniMax M3 模型

  1. 在 PAI-Model Gallery 模型广场找到MiniMax M3 模型,或通过链接直达该模型:

2. 在模型详情页右上角点击「部署」,选择计算资源后,即可一键完成云上部署。

MiniMax-M3已支持 vLLM 高性能部署框架 / SGLang 高性能部署框架,支持单机部署,需 8*GPU;

MiniMax-M3-MXFP8 已支持 vLLM 高性能部署框架单机部署,需8*GPU;

  1. 部署成功后,在服务页面可以点击"查看调用信息"获取调用的调用地址和 Token,想了解服务调用方式可以点击模型详情页,查看调用方式说明。

一键部署 Kimi K2.7 Code 模型

  1. 在 PAI-Model Gallery 模型广场找到Kimi K2.7 Code 模型,或通过链接直达该模型:
  1. 在模型详情页右上角点击「部署」,选择计算资源后,即可一键完成云上部署。

Kimi K2.7 Code已支持 vLLM 高性能部署框架 / SGLang 高性能部署框架,支持单机和 PD 分离部署,需 8*GPU;

  1. 部署成功后,在服务页面可以点击"查看调用信息"获取调用的调用地址和 Token,想了解服务调用方式可以点击模型详情页,查看调用方式说明。

Model Gallery 是阿里云人工智能平台 PAI 的产品组件,它集成了国内外 AI 开源社区中优质的预训练模型,涵盖了 LLM、AIGC、CV、NLP 等各个领域。通过 PAI 对这些模型的适配,用户可以以零代码方式实现从训练到部署再到推理的全过程,简化了模型的开发流程,为开发者和企业用户带来了更快、更高效、更便捷的 AI 开发和应用体验。

PAI-Model Gallery 访问地址: pai.console.aliyun.com/#/quick-sta...

阿里云 PAI-Model Gallery 已同步接入 MiniMax M3、Qwen3.6-35B-A3B、DeepSeek-V4、Kimi K2.6 与GLM-5.1 等最新主流模型,提供企业级部署方案。

✅ 零代码一键部署

✅ 自动适配云资源

✅ 开箱即用API

✅ 全流程运维托管

✅ 企业级安全 数据不出域

更多模型支持

PAI-Model Gallery 持续提供开源社区热门模型的快速部署、微调、蒸馏、评测实践,模型覆盖 Qwen、Wan、DeepSeek、Kimi、MiniMax 等优秀开源模型,同时还提供 Qwen3-235B-A22B-PAI-optimized、Qwen3-Next-80B-A3B-Instruct-FP8-PAI-optimized、DeepSeek-R1-0528-PAI-optimized 等 PAI 优化版本模型,内置了 PAI 优化版的 EP+PD 分离部署等模板,性能更优。

相关推荐
百度Geek说1 小时前
AI Coding 的底层框架:一切优化都是在对抗熵增
人工智能
小白鼠幻想家1 小时前
别再问我用哪个 Agent 框架了,看完这篇你自己选
agent
Java研究者1 小时前
AI智能体研发 | 什么是OpenAI API协议
人工智能·大模型·openai·api·agent·智能体
小七-七牛开发者2 小时前
Coding Agent 规则管理:CLAUDE.md、Skills、Hooks、Subagents 到底怎么选?
ai·大模型·agent·claude·token·loop·mcp·claudecode·ai coding
只是没名字2 小时前
Codex CLI Windows 新手安装教程:从 Node.js 到首次运行
人工智能
用户8630652696132 小时前
Krea 2 LoRA 训练全流程踩坑记录:从打标到双卡并行的 Windows 原生实战
人工智能
小白鼠幻想家2 小时前
Prompt Engineering 正在变成"汇编语言"
agent
CoovallyAIHub4 小时前
企业 AI 智能体落地:数据、趋势与判断
agent
木雷坞4 小时前
让 AI 编程助手跑得起项目:Dev Container 实践记录
人工智能