云上一键部署 DeepSeek-V3 模型，阿里云PAI Model Gallery 最佳实践

DeepSeek-V3 模型简介

DeepSeek-V3 是 DeepSeek 发布的 MoE（Mixture-of-Experts）大语言模型，总参数量为6710亿，每个 token 激活的参数量为370亿。为了实现高效的推理和成本效益的训练，DeepSeek-V3 采用了 MLA（Multi-head Latent Attention）和 DeepSeekMoE 架构。此外，DeepSeek-V3 首次引入了一种无需辅助损失的负载均衡策略，并设定了多token预测的训练目标，以提升性能。DeepSeek-V3在14.8万亿个多样且高质量的token上对模型进行了预训练，随后通过监督微调（SFT）和强化学习来充分发挥其潜力。

PAI-Model Gallery 简介

Model Gallery 是阿里云人工智能平台 PAI 的产品组件，它集成了国内外 AI 开源社区中优质的预训练模型，涵盖了 LLM、AIGC、CV、NLP 等各个领域。通过 PAI 对这些模型的适配，用户可以以零代码方式实现从训练到部署再到推理的全过程，简化了模型的开发流程，为开发者和企业用户带来了更快、更高效、更便捷的 AI 开发和应用体验。

PAI-Model Gallery 访问地址：https://pai.console.aliyun.com/#/quick-start/models

PAI-Model Gallery 一键部署 DeepSeek-V3

进入 Model Gallery 页面_（链接：https://pai.console.aliyun.com/#/quick-start/models）_

登录 PAI 控制台。
在顶部左上角根据实际情况选择地域。
在左侧导航栏选择工作空间列表，单击指定工作空间名称，进入对应工作空间内。
在左侧导航栏选择快速开始 > Model Gallery。

在 Model Gallery 页面的模型列表中，单击找到并点击 DeepSeek-V3 模型卡片，进入模型详情页面。

单击右上角部署，配置推理服务名称以及部署使用的资源信息，即可将模型部署到 PAI-EAS 推理服务平台。

使用推理服务。

在 PAI-Model Gallery > 任务管理 > 部署任务 中单击已部署的服务名称，在服务详情 页面右上角单击查看WEB应用，即可通过ChatLLM WebUI进行实时交互。

同时，部署的服务还支持 API 推理，API 使用方式可参考教程 5分钟使用EAS一键部署LLM大语言模型应用 （链接： https://help.aliyun.com/zh/pai/use-cases/deploy-llm-in-eas)

欢迎各位小伙伴持续关注使用 PAI-Model Gallery，平台会不断上线 SOTA 模型，如果您有任何模型需求，也可以联系我们。您可通过搜索钉钉群号79680024618，加入PAI-Model Gallery用户交流群。