华为云Flexus+DeepSeek征文 | 初探华为云ModelArts Studio:部署DeepSeek-V3/R1商用服务的详细步骤

华为云Flexus+DeepSeek征文 | 初探华为云ModelArts Studio:部署DeepSeek-V3/R1商用服务的详细步骤

  • 前言
  • [一、华为云ModelArts Studio平台介绍](#一、华为云ModelArts Studio平台介绍)
    • [1.1 ModelArts Studio介绍](#1.1 ModelArts Studio介绍)
    • [1.2 ModelArts Studio主要特点](#1.2 ModelArts Studio主要特点)
    • [1.3 ModelArts Studio使用场景](#1.3 ModelArts Studio使用场景)
    • [1.4 ModelArts Studio产品架构](#1.4 ModelArts Studio产品架构)
  • [二、访问ModelArts Studio大模型即服务平台](#二、访问ModelArts Studio大模型即服务平台)
    • [2.1 登录华为云](#2.1 登录华为云)
    • [2.2 进入ModelArts Studio介绍页](#2.2 进入ModelArts Studio介绍页)
    • [2.3 进入ModelArts Studio控制台](#2.3 进入ModelArts Studio控制台)
    • [2.4 配置ModelArts委托授权](#2.4 配置ModelArts委托授权)
    • [2.5 华为云账号充值](#2.5 华为云账号充值)
  • 三、开通DeepSeek-V3/R1商用服务
    • [3.1 预置服务介绍](#3.1 预置服务介绍)
    • [3.2 开通商用服务DeepSeek-V3-32K](#3.2 开通商用服务DeepSeek-V3-32K)
    • [3.3 开通商用服务DeepSeek-R1-32K](#3.3 开通商用服务DeepSeek-R1-32K)
  • 四、商用服务DeepSeek-V3/R1对比
  • 五、商用服务DeepSeek-V3/R1在线体验
    • [5.1 DeepSeek-V3-32K在线体验](#5.1 DeepSeek-V3-32K在线体验)
    • [5.2 DeepSeek-R1-32K在线体验](#5.2 DeepSeek-R1-32K在线体验)
    • [5.3 DeepSeek-V3/R1调用统计功能](#5.3 DeepSeek-V3/R1调用统计功能)
  • 六、使用体验与总结

前言


华为云ModelArts Studio作为一站式大模型即服务平台,凭借其强大的模型管理能力和简洁易用的操作界面,为企业和开发者提供了高效、稳定的AI服务部署体验。平台全面支持主流大模型的快速接入与商用服务开通,显著降低了AI应用开发的技术门槛。通过集成自动调优、资源按需分配、API调用监控等智能功能,ModelArts Studio实现了从模型训练到生产落地的无缝衔接。本文将以部署DeepSeek-V3和DeepSeek-R1商用服务为例,带领大家深入了解这一平台的强大能力与实际应用价值。


一、华为云ModelArts Studio平台介绍

1.1 ModelArts Studio介绍

🌟 平台介绍

ModelArts Studio是华为云提供的一个大模型即服务平台(MaaS服务),旨在简化模型开发流程,支持定制化大模型的开发,并使这些模型能够无缝集成到业务系统中。通过降低企业AI应用的成本和难度,ModelArts Studio助力企业快速实现AI技术落地。

👉 立即体验:通过ModelArts Studio,让大模型成为企业数字化转型的核心驱动力,解锁智能未来!

1.2 ModelArts Studio主要特点

  1. 全栈模型生态,性能卓越

    主流模型全覆盖 :集成Llama、Baichuan、Yi、Qwen、DeepSeek等99%业界SOTA开源模型,预适配昇腾算力底座,精度与推理性能显著提升。

    零代码自动化开发 :沉淀100+行业调优经验,提供一键训练、自动超参优化、标准化流水线 ,无需手动调参,开发周期缩短50%+。

    昇腾深度优化:基于昇腾算子与显存优化技术,训练/推理效率大幅提升,预置最优超参配置,开箱即用。

  2. 资源灵活可控,成本优化

    💡 按需付费,弹性扩缩 :分钟级获取算力资源,按实际使用收费,避免闲置浪费,降低AI入门门槛。

    💡 高可用性保障 :多数据中心部署,支持故障快速恢复(快恢)断点续训,确保训练任务不中断,保护项目连续性。

  3. 智能应用快速构建

    🤖 Agent开发加速器 :提供优质Prompt模板与智能Agent沉淀,支持复杂任务拆解(如多系统协同决策),快速生成业务专属智能体。

    🤝 组件化生态集成:即插即用MCP Server、LangChain、RAG、Guard等工具,一站式构建智能问答、知识管理、流程自动化等应用。

  4. 一站式全生命周期服务

    📦 全流程工具链 :覆盖模型调优、压缩、部署、评测等环节,支持「即开即用」,无需跨平台切换。

    ⚙️ 标准化流水线:内置性能与精度评价体系,自动化完成模型优化,确保全场景高性能表现。

1.3 ModelArts Studio使用场景

  1. 行业大模型定制开发

    🔹 金融/医疗/制造 :基于开源模型微调,快速构建风控分析、智能诊断、供应链优化等垂直领域大模型。

    🔹 优势:无需从头训练,依托昇腾优化提升行业数据适配性,降低定制成本。

  2. 复杂业务流程自动化

    🔹 企业级决策支持 :拆解项目级任务(如跨部门协作、多系统调用),通过智能Agent实现自动化决策与执行。

    🔹 典型场景:智能客服(多轮对话+知识库检索)、工单自动化处理、数据分析报告生成。

  3. 低成本AI创新探索

    🔹 中小企业/初创团队 :通过按需付费模式,零门槛试用大模型能力,快速验证业务场景(如营销文案生成、智能质检)。

    🔹 优势:分钟级启动开发,无需预置算力资源,试错成本降低80%。

  4. 高性能实时推理场景

    🔹 实时交互应用 :智能问答、推荐系统、工业实时监控等,依托昇腾优化保障低延迟、高并发推理。

    🔹 技术支撑:多数据中心容灾架构,确保7×24小时稳定服务。

  5. 多模态应用集成

    🔹 智能内容生成 :结合RAG(检索增强生成)与Guard(安全防护),构建企业级知识中台、数字人交互等多模态应用。

    🔹 组件化优势:快速集成LangChain等工具,实现「数据-模型-应用」闭环。

1.4 ModelArts Studio产品架构

华为云ModelArts Studio产品架构集成了模型服务、应用服务和资源管理等多个模块,支持从模型调优、压缩到部署的全生命周期管理,并提供丰富的插件和应用体验。其底层依托于ModelArts Standard平台,涵盖模型开发、数据工程、训练和推理等核心功能,确保高效灵活的AI开发流程。通过统一资源调度和AI专属资源池,ModelArts Studio实现了资源的按需使用和快速扩展,助力企业轻松应对复杂多变的业务需求。

二、访问ModelArts Studio大模型即服务平台

2.1 登录华为云

华为云官网:https://www.huaweicloud.com/,在电脑浏览器打开华为云官网后,点击"登录"选项,输入自己的华为云账号和密码,登录华为云官网。

2.2 进入ModelArts Studio介绍页

在华为云首页的产品------查看所有产品,搜索框内输入ModelArts Studio,即可看到ModelArts Studio大模型即服务平台,点击进去即可。

同时,可以直接输入ModelArts Studio的地址:https://www.huaweicloud.com/product/modelarts/studio.html,进入ModelArts Studio的介绍页。

2.3 进入ModelArts Studio控制台

在ModelArts Studio介绍页中,我们点击"ModelArts Studio控制台"。

刚开始进入时,会提示我们勾选"ModelArts Studio服务声明",勾选后,选择"确定"选项即可。

2.4 配置ModelArts委托授权

在ModelArts Studio控制台首页中,在页面上方我们看到依赖服务的授权提醒,我们按照提示点击"此处",配置相关授权即可。

快速添加授权:选择新增委托,权限配置则选择普通模式。将服务列表全选后,选择创建即可。

回到ModelArts Studio控制台首页后,可以看到授权提示已经消失。

2.5 华为云账号充值

为避免测试过程中出现部署失败等问题,请确保自己的华为云账号余额充足,建议保持账户余额大于10元。

三、开通DeepSeek-V3/R1商用服务

3.1 预置服务介绍

在ModelArts Studio控制台首页中。我们依次选择模型推理---在线推理------预置服务,可以看到商用服务和免费服务列表。预置服务为平台已部署好的服务,无等待时间,按token计费、适合快速测试

  • 服务类型与计费规则
类别 描述说明
服务类型 免费服务 / 商用服务
免费服务 - 仅限用于模型体验 - 受严格的速率限制 - 平台可能不定期调整支持的模型、免费额度及有效期等信息
商用服务 - 提供商用级别的推理 API 服务 - 开通后可获取付费 API 使用权限
  • 推理额度与使用方式
项目 说明
免费额度 单个模型提供 200万 token 推理额度
额度耗尽后处理方式 - 可开通商用级别推理 API(仅限区域:贵阳一) - 或前往"我的服务"部署为自定义服务后按需付费使用
优惠折扣相关信息 有关模型服务的优惠折扣发放与使用情况,请前往 费用中心查看

备注:如果需了解更多详情,建议访问华为云官方文档或费用中心页面。

3.2 开通商用服务DeepSeek-V3-32K

我们选择开通商用服务DeepSeek-V3-32K,其专注于内容生成、代码辅助与多轮对话,在长文本处理与逻辑连贯性方面表现出色。

注意保证华为云账户余额充足,确认开通DeepSeek-V3-32K服务。

查看DeepSeek-V3-32K服务开通状态,可以看到已经成功开通。

3.3 开通商用服务DeepSeek-R1-32K

我们选择开通商用服务DeepSeek-R1-32K,它聚焦于检索增强生成(RAG),适用于企业知识库问答、文档分析等强调准确性和可溯源性的场景。

查看DeepSeek-R1-32K服务开通状态,可以看到已经成功开通。

四、商用服务DeepSeek-V3/R1对比

  • 📊 模型功能与适用场景对比
对比维度 DeepSeek-V3-32K DeepSeek-R1-32K
核心能力 内容创作、代码生成、多轮对话、逻辑推理 检索增强生成(RAG)、知识库问答、文档分析
输入价格 ¥0.002 / 千 tokens ¥0.004 / 千 tokens
输出价格 ¥0.008 / 千 tokens ¥0.016 / 千 tokens
典型应用场景 技术文档撰写、自动化内容生成、智能客服、编程辅助 企业内部知识库查询、法律/金融文档解析、精准问答服务
响应速度 快速响应,适合实时交互 略慢(因涉及外部数据检索),但准确性高
优势特点 结构清晰、逻辑连贯、长文本记忆能力强 可溯源、精准回答、支持超长文本(如100K+)处理
局限性 对实时性知识依赖训练数据,可能存在滞后 响应时间较长,不适合极高时效性要求的场景

✅ 使用建议总结

  • 如果业务侧重于内容生成、代码编写或对话理解 ,推荐使用 DeepSeek-V3-32K,性价比高且响应迅速。
  • 如果应用更注重知识检索、答案可追溯性及超长文本处理 ,例如在企业知识库、法律合同分析等场景中,DeepSeek-R1-32K 更为合适。

💡 提示:结合具体业务需求测试两种模型的实际表现,将有助于选择最优方案。

五、商用服务DeepSeek-V3/R1在线体验

5.1 DeepSeek-V3-32K在线体验

在已开通的商用服务列表中,我们选择DeepSeek-V3-32K的在线体验选项。

在DeepSeek-V3-32K的对话框中,我们对其简单提问,让其介绍下自己,如下所示:

我们让DeepSeek-V3-32K编写一段以端午节祝福为主题的简单静态 HTML 网页代码。

  • 我们在对话框内,输入以下提示词:
bash 复制代码
请生成一段简单且美观的静态 HTML 代码,用于展示一个以 "端午节祝福" 为主题的网页。具体要求如下:
页面整体风格温馨、传统,体现浓厚的节日气氛;
使用柔和的中国传统色系(如红色、金色、浅绿、粽叶绿等);
包含标题(如"端午安康,粽情祝福!")、正文祝福语、背景图片或图案(可使用CSS模拟背景图或渐变);
添加字体动画或淡入效果,使页面更具观赏性;
使用 Google 字体(如 "Noto Serif CJK" 或 "Ma Shan Zheng" 等书法/手写字体)提升美感;
不使用外部 JS 和图片资源,所有样式通过内联 CSS 实现;
页面适配移动端,结构简洁,加载快速。

将生成的代码保存到本地电脑并命名为 .html 后缀的文件后,用浏览器打开即可查看页面效果,整体呈现非常美观、节日氛围浓厚。

5.2 DeepSeek-R1-32K在线体验

在已开通的商用服务列表中,我们选择DeepSeek-R1-32K的在线体验选项。

在 DeepSeek-R1-32K的对话框中,我们对其简单提问,让其介绍下自己,如下所示:

在DeepSeek-R1-32K对话框内,要求也一首现代诗,要求赞美夏天,要求质量高。给出的提示词如下所示:

bash 复制代码
请以"夏天"为主题,创作一首现代诗。要求如下:

语言优美,富有画面感和情感表达;
运用丰富的意象,如阳光、蝉鸣、荷花、雷雨、西瓜、微风等元素;
表达对夏天的喜爱与赞美,可融入自然之美、生命之力或时光之美的描写;
结构清晰,段落之间有节奏感和层次感;
风格清新自然或深沉热烈均可,避免陈词滥调,追求诗意创新。

生成的现代诗效果如下,整体质量还是令人非常满意的。

5.3 DeepSeek-V3/R1调用统计功能

ModelArts Studio 平台(MaaS服务)为 DeepSeek-V3 和 R1 模型提供了调用统计功能 ,可实时监控并记录模型服务的使用情况。 目前,调用统计数据仅针对通过 API 接口调用 产生的请求进行统计,页面体验等前端操作所触发的调用暂未纳入统计范围。

六、使用体验与总结

🌟 使用体验

在本次部署 DeepSeek-V3 与 DeepSeek-R1 商用服务的过程中,ModelArts Studio 展现出极高的易用性与稳定性。平台界面清晰直观,操作流程简洁流畅,即使是首次使用也能快速上手。从模型选择、服务开通到API调用,每一步都提供了详细的指引和实时反馈,极大提升了部署效率。整体体验下来,不仅感受到华为云在AI工程化落地方面的深厚技术积累,也对企业级AI服务平台的成熟度有了更深认知。

📈 总结展望

ModelArts Studio 凭借其强大的功能集成和灵活的资源调度能力,为企业大模型应用提供了坚实的技术底座。通过本次实践,我们验证了其在实际业务场景中的高效支持能力,特别是在模型性能、计费透明和调用监控方面的表现尤为突出。未来,随着更多大模型的接入和功能的持续优化,ModelArts Studio 将成为推动企业智能化转型的重要引擎。相信在华为云的持续赋能下,AI技术将更加快速、深入地融入各行各业的发展之中。


相关推荐
拾忆-eleven9 分钟前
NLP学习路线图(十四):词袋模型(Bag of Words)
人工智能·学习·自然语言处理·nlp
sbc-study42 分钟前
精英-探索双群协同优化(Elite-Exploration Dual Swarm Cooperative Optimization, EEDSCO)
人工智能
白熊1881 小时前
【机器学习基础】机器学习入门核心算法:XGBoost 和 LightGBM
人工智能·算法·机器学习
微学AI2 小时前
智能穿戴新标杆:SD NAND (贴片式SD卡)与 SOC 如何定义 AI 眼镜未来技术路径
人工智能·ai·sd
拾忆-eleven2 小时前
NLP学习路线图(十五):TF-IDF(词频-逆文档频率)
人工智能·学习·自然语言处理·nlp
封奚泽优3 小时前
使用Python绘制节日祝福——以端午节和儿童节为例
人工智能·python·深度学习
全域智图3 小时前
元胞自动机(Cellular Automata, CA)
人工智能·算法·机器学习
富唯智能3 小时前
复合机器人:纠偏算法如何重塑工业精度与效率?
人工智能·工业机器人·智能机器人
s153353 小时前
3.RV1126-OPENCV 图像叠加
人工智能·opencv·计算机视觉
珂朵莉MM3 小时前
2022 RoboCom 世界机器人开发者大赛-本科组(省赛)解题报告 | 珂学家
人工智能·算法·职场和发展·深度优先·图论