目录
[3.2 参数配置](#3.2 参数配置)
[3.3 资源栈设置](#3.3 资源栈设置)
[3.4 创建执行计划](#3.4 创建执行计划)
[3.5 资源部署](#3.5 资源部署)
[3.6 常见错误](#3.6 常见错误)
[1. CCE 授权失败](#1. CCE 授权失败)
[2. 费用不足或资源冻结](#2. 费用不足或资源冻结)
[3. 密码过于简单(RDS 创建失败)](#3. 密码过于简单(RDS 创建失败))
[4.1 访问Dify-LLM应用开发平台](#4.1 访问Dify-LLM应用开发平台)
[4.2 设置管理员账户](#4.2 设置管理员账户)
[4.3 登录Dify-LLM应用开发平台](#4.3 登录Dify-LLM应用开发平台)
[4.5 一键卸载](#4.5 一键卸载)
[4.6 资源和成本规划](#4.6 资源和成本规划)
一、前言
大语言模型(LLM)开发平台正成为企业智能化转型的核心基础设施。传统部署方案存在资源调度复杂、扩展性差、运维成本高等痛点。本文将深入解析如何基于华为云Flexus云服务,通过容器引擎CCE Turbo的一键高可用部署方案 ,快速构建集群生产级Dify-LLM应用开发平台,重点呈现该方案在自动化 、弹性扩展、容灾能力、运维效率等方面的技术优势。

二、华为云Flexus云服务核心优势
首先先简单介绍一下华为云Flexus,其在性能优化、部署便捷性、安全性和成本效益方面均优于普通云服务器,更适合高效、稳定地部署Dify-LLM应用开发平台,主要体现在下面几点
- **性能优化:**支持智能资源调度和硬件加速(GPU/FPGA),可自动调整计算资源,并优化应用负载性能,显著提升算力效率。
- 部署便捷性 :提供预置模板和自动化部署工具,用户只需简单配置即可快速完成部署,并支持可视化管控,降低运维难度。
- 安全性:提供多层次安全防护(VPC网络隔离、数据加密、应用防火墙等),保障平台稳定性和数据安全。。
- 成本低:支持按需付费,灵活调整资源,并提供优惠套餐,结合高性能与高可靠性,降低总体拥有成本(TCO)。
基于Flexus云服务搭建Dify集群架构图如下:

同时对于新手来说**,**提供开箱即用的一键集群部署方案,用户无需掌握K8s底层知识,通过Web界面3步即可完成基础环境搭建。
三、华为云Flexus高可用部署Dify平台
上述已经简单介绍了华为云Flexus云服务具有搭建Dify集群的优势,接下来将开始实操部分,手把手完成高可用部署Dify集群。点击访问快速搭建Dify-LLM应用开发平台-华为云,选择CCR容器高可用部署。

3.1模板选择
创建资源栈,按照默认即可

3.2 参数配置
主要需要以下参数配置:
-
CCE Turbo 集群
创建高性能容器集群,并纳管 3台 FlexusX 实例 作为节点。
-
FlexusX 计算实例
部署 1台 FlexusX 实例 ,运行 Embedding(bge-m3) 和 Reranker(bge-reranker-v2-m3) 模型。
-
对象存储 (OBS)
创建 OBS 桶,用于存储 Dify 知识库数据。
-
分布式缓存 (Redis)
部署 Redis®* 版,提供高性能、低成本的 NoSQL 存储,保障数据一致性。
-
云数据库 (RDS for PostgreSQL)
创建 主备架构的 PostgreSQL 实例,支持跨可用区容灾。
-
云搜索 (CSS OpenSearch)
部署 OpenSearch 集群,提供分布式搜索及语义搜索功能。
具体如图配置:

3.3 资源栈设置
选择回滚设置,其他默认配置即可。

3.4 创建执行计划
最后一步参数确认,这里会重新确认需要第二步配置的参数。

参数确认没问问题,点击创建执行计划,便会开始自动化创建资源。

3.5 资源部署
执行计划创建完成之后,在执行计划中可以看到资源创建成功,接下来就可以进行资源部署。

惦记部署之后,在弹出框,再一次确认需要执行的计划。
点击执行,在这里查看部署过程事件,可以看到对应CCE集群、 FlexusX 计算实例、对象存储 OBS、分布式缓存 (Redis) 、**云搜索 (CSS OpenSearch)**都在自动部署。

等待一段时间之后,当事件出现"Apply required resource success",说明高可用Dify-LLM集群平台部署成功了。

3.6 常见错误
3.6.1 CCE 授权失败
- 现象 :部署时提示
CCE授权失败
或类似错误,具体报错内容如下:

- 解决方案 :
- 进入 CCE 控制台 ,手动完成授权操作,如图所示,重新授权,授权成功之后,重新部署。
- 进入 CCE 控制台 ,手动完成授权操作,如图所示,重新授权,授权成功之后,重新部署。
3.6.2 费用不足或资源冻结
- 现象 :具体报错信息如图所示
- 原因:账户欠费或资源配额冻结,或者余额不足。
- 解决方案 :
- 登录华为云控制台,检查 账户余额 是否充足,建议将余额充值到70元以上
3.6. 3 密码过于简单(RDS 创建失败)
- 现象:出现如下报错信息
huaweicloud_rds_instance.rds: Creation errored after 0s, Diagnostic details : [Error: error creating RDS instance: Bad request with: [POST https://rds.cn-north-4.myhuaweicloud.com/v3/8b22b15d28834930a1fecea23bced86f/instances\], request_id: 7706d8bb2d56c136ecf8491061c58b33, error message: {"error_msg":"Weak password.","error_code":"DBS.280203"}
Diagnostic range : {"filename":"main.tf","start":{"line":368,"column":43,"byte":13964},"end":{"line":368,"column":44,"byte":13965}}
Diagnostic snippet : resource "huaweicloud_rds_instance" "rds"
- 原因:RDS 实例密码不符合安全策略(如长度不足、缺少复杂字符)。
- 解决方案 :
- 修改 Terraform 配置中的
password
字段,确保密码符合要求(通常需包含大小写字母、数字和特殊字符,长度≥8位)。
- 修改 Terraform 配置中的
四、体验高可用Dify-LLM应用平台
高可用Dify-LLM集群部署完成后,接下来就可以通过浏览器访问Dify-LLM应用开发平台了默认访问地址为 <ECS公网IP地址>:80。
4.1 访问Dify-LLM应用开发平台
进入资源控制台,点击输出,在登录说明中可以看到,Dify-LLM应用开发平台访问的地址,复制到浏览器打开。

4.2 设置管理员账户
第一打开可能有点慢,可以稍等片刻,重新打开。首次登录Dify平台后,系统会引导设置 管理员账户,这里需要记住邮箱和密码,后续登录需要施一公这两个即可。

4.3 登录Dify-LLM应用开发平台
管理员账户设置完毕之后,重新回到登录页面,这里就可以使用刚刚注册的邮箱和密码进行登录。

成功登录后,进入Dify平台的 "应用管理" 或 "工作台",如图Dify平台首页,可以进行聊天助手搭建,或者创建AI Agent。

4.5 一键卸载
如果使用完毕之后,可以回到资源资源控制台中,进行资源删除,避免金额扣费。

点击删除,在弹出的删除资源栈确定框中,删除方式选择删除资源,输入Delete,单击"确定",即可卸载解决方案

4.6 资源和成本规划
部署完CCE容器高可用Dify-LLM平台,对于响应的费用扣取也要有所了解,以下是关于资源和成本规划(按需计费)。
华为云服务 | 配置示例 | 数量 | 每月预估花费 |
---|---|---|---|
虚拟私有云 VPC | * 区域:华北-北京四 * VPC网段:192.168.0.0/16 | 1 | 0.00 |
子网 Subnet | * 区域:华北-北京四 * 子网网段:192.168.1.0/24, 192.168.2.0/24, 192.168.3.0/24, 192.168.4.0/24 * 网关:192.168.0.1, 192.168.1.1,192.168.2.1,192.168.3.1 | 4 | 0.00 |
安全组 SecurityGroup | * 区域:华北-北京四 | 4 | 0.00 |
华为云Flexus云服务器X实例 | * 按需计费:1.42元/小时 * 区域:华北-北京四 * 规格:Flexus云服务器X实例 | 性能模式(关闭)| x1.16u.16g | 16核 | 16 GB * 镜像:Ubuntu 22.04 server 64bit * 系统盘:高IO | 40GB * 数据盘:高IO | 100 GiB | 3 | 3064.18元 |
华为云Flexus云服务器X实例 | * 按需计费:4.53元/小时 * 区域:华北-北京四 * 规格:Flexus云服务器X实例 | 性能模式(开启)| x1e.32u.32g | 32核 | 32 GB * 镜像:Ubuntu 22.04 server 64bit * 系统盘:通用型SSD | 40GB | 1 | 3262.18元 |
弹性公网IP EIP | * 区域:华北-北京四 * 计费模式:按需计费 * 线路:动态BGP * 公网带宽:按流量计费 * 带宽大小:300Mbit/s | 3 | 0.80元/GB |
对象存储服务 OBS | * 区域:华北-北京四 * 存储空间:数据存储(多AZ存储) * 默认存储类别:标准存储 * 桶策略:私有 * 请求费用:GET/PUT 0.01元/万次,DELETE 免费 * 存储空间:0.1390元/GB/月 * 流量费用: * 内/公网流入流量(数据上传到OBS):0元 * 内网流出流量(通过ECS云服务器下载OBS的数据): 0元公网流出流量 / 00:00-08:00(闲时):0.2500元/GB 公网流出流量 / 08:00-24:00(忙时): 0.5000元/GB | 1 | 详细请参考每月账单。计费说明参考价格详情 |
云容器引擎 CCE | * 按需计费:2.91元/小时 * 区域:华北-北京四 * 计费模式:按需计费 * 规格:cce.s2.small(50节点) * 集群 master 实例数: 3 * 集群 node 实例数: 3 * 类型:CCE | 1 | 2095.20元 |
分布式缓存服务Redis®*版 | * 按需计费:0.58元/小时 * 区域:华北-北京四 * 计费模式:按需计费 * 规格:4G (基础版)| 副本数:2 * 实例类型:Redis(主备) | 1 | 414.72元 |
云数据库 RDS for PostgreSQL | * 按需计费:1.24元/小时 * 区域:华北-北京四 * 计费模式:按需计费 * 规格:rds.pg.n1.large.2.ha | 2 vCPU | 4 GB (通用型) * 储存:SSD云盘 | 100GB * 数据库引擎:PostgreSQL(主备) | 1 | 892.80元 |
云搜索服务 CSS | * 按需计费:3.98元/小时 * 区域:华北-北京四 * 计费模式:按需计费 * 规格: ess.spec-4u8g | 4 vCPUs | 8 GB * 节点存储总容量:超高I/O | 120GB * 集群类型:OpenSearch * 节点数:3 | 1 | 2864.16元 |
弹性负载均衡 ELB | * 区域:华北-北京四 * 可用区数量:2 * 计费模式:按需计费 * 独享型负载均衡 * 网络型 | 弹性规格、应用型 | 弹性规格 * 按需计费:¥0.15/小时+应用型LCU费用:¥0.05/个·小时(按实际使用量收取LCU费用) | 1 | 108元 **+**应用型LCU费用 |
NAT网关 NAT | * 按需计费:12元/天 * 区域:华北-北京四 * 规格:小型 * SNAT规则数:3 | 1 | 360元 |
合计 | - | - | 13061.24元 + 应用型LCU费用 + 弹性公网IP EIP费用 +对象存储服务OBS存储及流量费用 |
综上所述需要部署一个高可用的Dify-LLM集群应用费用是:35~70元(按需计费:X实例、EIP、OBS、CCE、Redis、RDS、CSS、ELB、NAT等资源累积约35元/小时,体验本方案预计成本不超过70元)
五、部署感受与总结
通过基于华为云Flexus云服务的CCE容器高可用部署完Dify-LLM应用之后,个人感受颇多。总结如下两部分:
优势:
0代码部署:通过华为云Flexus预置模板和可视化界面,无需编写YAML或掌握Kubernetes底层操作,显著降低AI基础设施部署的技术门槛。
全程自动化:资源栈编排实现从计算节点、存储到服务的自动化部署,支持一键回滚和状态追踪,减少人为操作失误,提升部署效率。
成本优化:按需付费模式灵活适配业务需求,支持资源动态扩缩容,低至35元/小时。
售后无忧:全栈高可用架构,华为云生态整合,背后强大团队保驾护航。
不足与其他优化
错误处理机制优化**:**部分依赖服务(如RDS密码策略)的校验提示滞后,导致部署中途失败后需全局回滚。
成本回滚逻辑完善:部署失败时已产生费用,无法自动退还。