如何在百度百舸部署满血版DeepSeek-V3、DeepSeek-R1模型

百度百舸·AI异构计算平台已支持快速部署DeepSeek-V3、DeepSeek-R1及其蒸馏的Llama、Qwen等小规模dense模型。您可以登录百度百舸平台快速部署DeepSeek系列模型体验模型效果。

01 开通轻量计算实例

开通一台H20(ebc.lgn7t.c208m2048.8h20.4d)规格的计算实例并添加到百度百舸·AI异构计算平台。

02 部署vLLM

在百度百舸平台的左侧导航中选择「工具市场」页面,部署工具vLLM。

03 模型推理

vLLM部署成功,登录实例下载模型并启动vLLM服务,安装WebUl客户端。

发送请求开始对话。

04 各系列模型的推荐配置清单

在完成满血版DeepSeek模型的快速部署后,百度百舸·AI异构计算平台还能为这些在线服务提供全生命周期管理、自研框架推理加速、推理资源碎片整理等能力。在保障服务稳定性的同时,有效降低推理成本并提升推理性能。

访问百度百舸页面cloud.baidu.com/product/aih...

------------END------------

推荐阅读

首日调用客户破1.5万!DeepSeek-V3/R1上线背后的超低推理成本技术揭秘

唤醒 AI 算力,专有云 ABC Stack 面向企业级智算平台的 GPU 提效实践

百度APP iOS端磁盘优化实践(上)

对话AI原生|比帮你写代码更爽的是:让Agent来打工

0 Token 间间隔 100% GPU 利用率,百度百舸 AIAK 大模型推理引擎极限优化 TPS

相关推荐
你好~每一天1 天前
2025 中小企业 AI 转型:核心岗技能 “怎么证、怎么用”?
人工智能·百度·数据挖掘·数据分析·职业·转行
三天不学习5 天前
uniapp集成语音识别与图片识别集成方案【百度智能云】
百度·uni-app·语音识别
semantist@语校6 天前
语校网500所里程碑:日本语言学校数据库的标准化与可追溯机制
大数据·数据库·人工智能·百度·语言模型·oracle·github
KKKlucifer7 天前
IDC发布AI+政务、财政、应急三大市场空间与厂商份额报告
人工智能·百度·政务
SEO_juper8 天前
AEO 与 SEO 双引擎:整合策略赢得搜索全域可见性
搜索引擎·百度·ai·seo·数字营销·seo优化·aeo
资讯全球9 天前
2025年用户体验佳的大型企业报销系统
人工智能·百度·ux
武汉唯众智创11 天前
面向新质生产力,职业院校“人工智能”课程教学解决方案
人工智能·百度·新质生产力·人工智能+
Hello123网站11 天前
文心大模型4.5:百度推出的新一代原生多模态基础大模型
百度·ai工具
嘀咕博客11 天前
文心大模型X1:百度推出的新一代深度思考模型
百度·ai工具