华为云Flexus+DeepSeek征文| 使用华为云CCE容器部署Dify-LLM高可用方案的验证与测试

华为云Flexus+DeepSeek征文| 使用华为云CCE容器部署Dify-LLM高可用方案的验证与测试

  • [1. 概述](#1. 概述)
  • [2. Dify高可用方案验证与测试](#2. Dify高可用方案验证与测试)
    • [2.1. FlexusX实例](#2.1. FlexusX实例)
    • [2.2. 分布式缓存服务Redis](#2.2. 分布式缓存服务Redis)
    • [2.3. 云数据库RDS](#2.3. 云数据库RDS)
    • [2.4. 云搜索服务CSS OpenSearch集群](#2.4. 云搜索服务CSS OpenSearch集群)
    • [2.5. 云容器引擎 CCE Turbo集群](#2.5. 云容器引擎 CCE Turbo集群)
  • [3. Dify高可用集群测试总结](#3. Dify高可用集群测试总结)

1. 概述

根据架构图咱们依次对各个组件进行高可用方案测试

我们还是使用在部署完Dify-LLM高可用平台后的"旅游Agent"作为高可用方案验证的例子,在我们关停某个组件后如果"旅游Agent"不受影响,那么就满足高可用方案。

未进行高可用操作之前先验证下"旅游Agent"功能,确保"旅游Agent"功能是完全正常的。

2. Dify高可用方案验证与测试

2.1. FlexusX实例

因为有三台FlexusX实例,三台FlexusX实例安装部署Dify5个核心插件,接下来我们关闭其中一台FlexusX实例

执行关机后,确保FlexusX实例状态变为关机状态:

验证一下目前"旅游Agent",结论是不受任何影响,可以继续使用

因为一共三台FlexusX实例安装部署Dify5个核心插件,上面已经关闭了一台,如果再关闭其中一台FlexusX实例呢?

接下来我们再关闭一个FlexusX实例,确保有两台FlexusX实例状态变为关机状态:

结论:虽然功能不受影响,但是智能体的响应速度人为感知明显变慢了很多

为了后续验证工作的继续,先恢复一个FlexusX实例节点,接下来再验证下将部署Embedding(bge-m3)及Reranker(bge-reranker-v2-m3)模型的FlexusX实例关闭

确保部署Embedding(bge-m3)及Reranker(bge-reranker-v2-m3)模型的FlexusX实例状态变为关机状态

结论:验证Dify平台功能不受影响,性能几乎也不受影响

2.2. 分布式缓存服务Redis

Redis服务是主从架构,但是不能单独操作主从节点,如果主节点出现故障后会自动切换从节点

现在Redis主节点是192.168.1.119,接下来模拟主节点故障,然后手动进行主从切换

现在主从节点切换完成,原来的主节点变为了从节点,从节点变为了主节点

结论:验证Dify平台功能不受影响,性能几乎也不受影响

2.3. 云数据库RDS

云数据库PostgreSQL实例,使用主备方式部署,同样也不能单独操作主从节点,如果主节点出现故障后会自动切换从节点

现在模拟主节点故障,然后手动进行主从切换,生产环境会自动进行主从切换

点击"是"按钮后会进行主从节点切换

主备切换过程中会导致Dify平台不可用

结论:主备切换完成之后服务恢复正常,验证功能正常,性能不受影响

2.4. 云搜索服务CSS OpenSearch集群

直接对集群进行重启,验证一下重启过程中以及重启后Dify是否有影响

状态显示为"重启中"

结论:验证功能正常,性能不受影响

2.5. 云容器引擎 CCE Turbo集群

CCE Turbo集群是容器的管理工具,最后验证将CCE Turbo集群删除

结论:Dify平台访问无影响,但是聊天交互基本上已无应答,功能受到影响

3. Dify高可用集群测试总结

本篇博文对华为云Dify高可用集群进行的测试,主要验证了高可用系统的稳定性与性能。测试中模拟了节点故障场景,结果显示主备服务节点能够快速切换至备用节点,持续提供服务,验证了高可用架构的有效性。同时,性能测试表明,集群在负载均衡下运行平稳,无明显性能瓶颈。不过在测试中发现部分场景下主从切换过程会导致集群不可用,日志监控输出不够完善。希望加强系统主从切换日志的一些输出,以进一步提升系统的响应速度和可维护性。总体而言,本次测试华为云Dify高可用平台无论是在性能还是稳定性上都能满足企业的开发需求。

相关推荐
HIT_Weston1 天前
93、【Ubuntu】【Hugo】搭建私人博客:面包屑(一)
linux·运维·ubuntu
cuijiecheng20181 天前
Linux下Beyond Compare过期
linux·运维·服务器
程序员佳佳1 天前
【万字硬核】从零构建企业级AI中台:基于Vector Engine整合GPT-5.2、Sora2与Veo3的落地实践指南
人工智能·gpt·chatgpt·ai作画·aigc·api·ai编程
喵叔哟1 天前
20.部署与运维
运维·docker·容器·.net
HIT_Weston1 天前
92、【Ubuntu】【Hugo】搭建私人博客:侧边导航栏(六)
linux·运维·ubuntu
CodeAllen嵌入式1 天前
Windows 11 本地安装 WSL 支持 Ubuntu 24.04 完整指南
linux·运维·ubuntu
RisunJan1 天前
Linux命令-ipcs命令(报告进程间通信(IPC)设施状态的实用工具)
linux·运维·服务器
HABuo1 天前
【Linux进程(四)】进程切换&环境变量深入剖析
linux·运维·服务器·c语言·c++·ubuntu·centos
橘颂TA1 天前
【Linux】死锁四条件的底层逻辑:从锁冲突到 STL 组件的线程安全实践(Ⅵ)
linux·运维·服务器·c++·死锁