DeepSeek-V4来啦!PAI已支持一键部署,共同迈向百万上下文普惠时代!

模型介绍

**DeepSeek-V4 已正式上线并同步开源。**DeepSeek-V4 拥有百万字超长上下文,在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。本次发布共有 Deepseek-V4-Pro 和 Deepseek-V4-Flash 两个版本。PAI 平台现已支持 DeepSeek-V4 全系模型,一键即可部署调用!

  • **Deepseek-V4-Pro:Agent 能力大幅提高,**在 Agentic Coding 评测中,V4-Pro 已达到当前开源模型最佳水平,且已成为深度求索公司内部员工使用的 Agentic Coding 模型,性能比肩 Claude Opus 4.6 等顶级闭源模型;拥有丰富的世界知识,在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型 Gemini-Pro-3.1并拥有世界顶级推理性能。

  • Deepseek-V4-Flash:相比 DeepSeek-V4-Pro,在世界知识储备方面稍逊一筹,但 Flash 版本展现出了接近的推理能力,在 Agent 测评中,DeepSeek-V4-Flash 在简单任务上与 DeepSeek-V4-Pro 旗鼓相当,凭借其较小的模型参数和激活,是更快捷高效的经济之选

除 DeepSeek 外,PAI-Model Gallery 同样支持 Qwen3.6-35B-A3B、Kimi K2.6、Minimax-M2.7、GLM-5.1 等前沿模型的一键部署,并可使用真武 810E 高效支持大模型训练及推理需求!

Model Gallery 是阿里云人工智能平台 PAI 的产品组件,它集成了国内外 AI 开源社区中优质的预训练模型,涵盖了 LLM、AIGC、CV、NLP 等各个领域。通过 PAI 对这些模型的适配,用户可以以零代码方式实现从训练到部署再到推理的全过程,简化了模型的开发流程,为开发者和企业用户带来了更快、更高效、更便捷的 AI 开发和应用体验。

**PAI-Model Gallery 访问地址:**pai.console.aliyun.com/#/quick-sta...

阿里云 PAI-Model Gallery 已同步接入 DeepSeek-V4、Kimi K2.6、Minimax-m2.7、GLM-5.1 与 Qwen3.6-35B-A3B 等最新主流模型,提供企业级部署方案。

✅ 零代码一键部署

✅ 自动适配云资源

✅ 开箱即用API

✅ 全流程运维托管

✅ 企业级安全 数据不出

一键部署 DeepSeek-V4 模型

⬇️ 立即体验 ⬇️

  1. 在 PAI-Model Gallery 模型广场找到 DeepSeek-V4-Pro、DeepSeek-V4-Flash 模型,或通过链接直达该模型:
  1. 在模型详情页右上角点击**「部署」**,选择计算资源后,即可一键完成云上部署。

**DeepSeek-V4-Pro:**已支持 vLLM 高性能部署框架,支持单机和分布式部署,需 8*GPU 或以上资源;

**DeepSeek-V4-Pro-FP8:**已支持 SGLang 高性能部署框架,支持分布式部署,需 16*GPU 资源;

**Deepseek-V4-Flash:**已支持 vLLM 高性能部署框架,需 8*GPU 资源;

**Deepseek-V4-Flash-FP8:**已支持 SGLang 高性能部署框架,需 4*GPU 资源;

  1. 部署成功后,在服务页面可以点击"查看调用信息"获取调用的调用地址和 Token,想了解服务调用方式可以点击模型详情页,查看调用方式说明。

更多模型支持

PAI-Model Gallery 持续提供开源社区热门模型的快速部署、微调、蒸馏、评测实践,模型覆盖 Qwen、Wan、DeepSeek、Kimi、MiniMax 等优秀开源模型,同时还提供 Qwen3-235B-A22B-PAI-optimized、Qwen3-Next-80B-A3B-Instruct-FP8-PAI-optimized、DeepSeek-R1-0528-PAI-optimized 等 PAI 优化版本模型,内置了 PAI 优化版的 EP+PD 分离部署等模板,性能更优。

联系我们

欢迎各位小伙伴持续关注使用 PAI-Model Gallery,平台会不断上线 SOTA 模型,如果您有任何模型需求,也可以联系我们。您可通过搜索钉钉群号**(77450028832)**,加入 PAI-Model Gallery 用户交流群。

相关推荐
张二娃同学9 小时前
第08篇_RNN_LSTM_GRU序列模型
人工智能·python·rnn·深度学习·神经网络·gru·lstm
财经资讯数据_灵砚智能9 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年5月13日
大数据·人工智能·python·信息可视化·语言模型·自然语言处理
我的世界洛天依9 小时前
胡桃讲编程|公益开源模型「初音未来」R1 声库(RVCv2 第一代)开发日志:低配 1050Ti 也能训的经典国语声线
人工智能
qq_411262429 小时前
四博AI睡眠眼罩方案:白噪音、音乐疗愈、AI情绪陪伴,把智能音箱做成贴身睡眠助手
人工智能·智能音箱
掘金安东尼9 小时前
AI 时代没必要太焦虑:当 Codex 已经打开即用,为啥还要折腾“小龙虾”?
人工智能
qq_411262429 小时前
基于 ESP32-S3 的四博AI双目智能音箱方案:双目同显/异显、素材上传、触摸、G-sensor、舵机、Wi-Fi/4G/TWS音频扩展
人工智能·microsoft·智能音箱
RSTJ_16259 小时前
PYTHON+AI LLM DAY FOURTY-FIVE
人工智能
卷卷说风控9 小时前
【卷卷观察】取消订阅后项目“消失“:Claude Design 暴露了SaaS的访问权陷阱
人工智能
我鑫如一9 小时前
专业的AI API中转站厂家
人工智能·python
腾讯云开发者9 小时前
腾讯云TVP走进银河通用×NVIDIA×福田戴姆勒,解码AI驱动产业硬核突围之路
人工智能