云上一键部署 DeepSeek-V3 模型,阿里云PAI Model Gallery 最佳实践

DeepSeek-V3 模型简介

DeepSeek-V3 是 DeepSeek 发布的 MoE(Mixture-of-Experts)大语言模型,总参数量为6710亿,每个 token 激活的参数量为370亿。为了实现高效的推理和成本效益的训练,DeepSeek-V3 采用了 MLA(Multi-head Latent Attention)和 DeepSeekMoE 架构。此外,DeepSeek-V3 首次引入了一种无需辅助损失的负载均衡策略,并设定了多token预测的训练目标,以提升性能。DeepSeek-V3在14.8万亿个多样且高质量的token上对模型进行了预训练,随后通过监督微调(SFT)和强化学习来充分发挥其潜力。

Model Gallery 是阿里云人工智能平台 PAI 的产品组件,它集成了国内外 AI 开源社区中优质的预训练模型,涵盖了 LLM、AIGC、CV、NLP 等各个领域。通过 PAI 对这些模型的适配,用户可以以零代码方式实现从训练到部署再到推理的全过程,简化了模型的开发流程,为开发者和企业用户带来了更快、更高效、更便捷的 AI 开发和应用体验。

PAI-Model Gallery 访问地址:https://pai.console.aliyun.com/#/quick-start/models

  1. 进入 Model Gallery 页面_(链接:https://pai.console.aliyun.com/#/quick-start/models)_
  • 登录 PAI 控制台。
  • 在顶部左上角根据实际情况选择地域。
  • 在左侧导航栏选择工作空间列表,单击指定工作空间名称,进入对应工作空间内。
  • 在左侧导航栏选择快速开始 > Model Gallery。
  1. 在 Model Gallery 页面的模型列表中,单击找到并点击 DeepSeek-V3 模型卡片,进入模型详情页面。
  1. 单击右上角部署,配置推理服务名称以及部署使用的资源信息,即可将模型部署到 PAI-EAS 推理服务平台。
  1. 使用推理服务。

PAI-Model Gallery > 任务管理 > 部署任务 中单击已部署的服务名称,在服务详情 页面右上角单击查看WEB应用,即可通过ChatLLM WebUI进行实时交互。

同时,部署的服务还支持 API 推理,API 使用方式可参考教程 5分钟使用EAS一键部署LLM大语言模型应用 (链接: https://help.aliyun.com/zh/pai/use-cases/deploy-llm-in-eas)

欢迎各位小伙伴持续关注使用 PAI-Model Gallery,平台会不断上线 SOTA 模型,如果您有任何模型需求,也可以联系我们。您可通过搜索钉钉群号79680024618,加入PAI-Model Gallery用户交流群。

相关推荐
沐雪架构师32 分钟前
Docling将pdf转markdown以及与AI生态集成
人工智能·pdf
kevin 134 分钟前
扫描件、PDF、图片都能比对!让文档差异无所遁形
大数据·人工智能·pdf
算家云1 小时前
腾讯最新开源HunyuanVideo-Foley本地部署教程:端到端TV2A框架,REPA策略+MMDiT架构,重新定义视频音效新SOTA!
人工智能·音视频·算家云·hunyuanvideo·模型部署教程·镜像社区
小王爱学人工智能1 小时前
迁移学习的案例
人工智能·机器学习·迁移学习
源雀数智1 小时前
源雀SCRM开源:企微文件防泄密
java·人工智能·企业微信·流量运营
Honeysea_701 小时前
容器的定义及工作原理
人工智能·深度学习·机器学习·docker·ai·持续部署
fantasy_arch1 小时前
SVT-AV1 svt_aom_motion_estimation_kernel 函数分析
人工智能·算法·av1
Acrel136119655141 小时前
别让电能质量问题拖后腿:工业场景中电能治理的战略意义
大数据·人工智能·能源·创业创新
長琹1 小时前
AES加密算法详细加密步骤代码实现--身份证号码加解密系统
网络·数据库·人工智能·python·密码学
一只鱼丸yo1 小时前
70B大模型也能在笔记本上跑?揭秘让AI“瘦身”的黑科技
人工智能·科技·机器学习·语言模型