华为云Flexus+DeepSeek征文| 使用华为云CCE容器部署Dify-LLM高可用方案的验证与测试

华为云Flexus+DeepSeek征文| 使用华为云CCE容器部署Dify-LLM高可用方案的验证与测试

  • [1. 概述](#1. 概述)
  • [2. Dify高可用方案验证与测试](#2. Dify高可用方案验证与测试)
    • [2.1. FlexusX实例](#2.1. FlexusX实例)
    • [2.2. 分布式缓存服务Redis](#2.2. 分布式缓存服务Redis)
    • [2.3. 云数据库RDS](#2.3. 云数据库RDS)
    • [2.4. 云搜索服务CSS OpenSearch集群](#2.4. 云搜索服务CSS OpenSearch集群)
    • [2.5. 云容器引擎 CCE Turbo集群](#2.5. 云容器引擎 CCE Turbo集群)
  • [3. Dify高可用集群测试总结](#3. Dify高可用集群测试总结)

1. 概述

根据架构图咱们依次对各个组件进行高可用方案测试

我们还是使用在部署完Dify-LLM高可用平台后的"旅游Agent"作为高可用方案验证的例子,在我们关停某个组件后如果"旅游Agent"不受影响,那么就满足高可用方案。

未进行高可用操作之前先验证下"旅游Agent"功能,确保"旅游Agent"功能是完全正常的。

2. Dify高可用方案验证与测试

2.1. FlexusX实例

因为有三台FlexusX实例,三台FlexusX实例安装部署Dify5个核心插件,接下来我们关闭其中一台FlexusX实例

执行关机后,确保FlexusX实例状态变为关机状态:

验证一下目前"旅游Agent",结论是不受任何影响,可以继续使用

因为一共三台FlexusX实例安装部署Dify5个核心插件,上面已经关闭了一台,如果再关闭其中一台FlexusX实例呢?

接下来我们再关闭一个FlexusX实例,确保有两台FlexusX实例状态变为关机状态:

结论:虽然功能不受影响,但是智能体的响应速度人为感知明显变慢了很多

为了后续验证工作的继续,先恢复一个FlexusX实例节点,接下来再验证下将部署Embedding(bge-m3)及Reranker(bge-reranker-v2-m3)模型的FlexusX实例关闭

确保部署Embedding(bge-m3)及Reranker(bge-reranker-v2-m3)模型的FlexusX实例状态变为关机状态

结论:验证Dify平台功能不受影响,性能几乎也不受影响

2.2. 分布式缓存服务Redis

Redis服务是主从架构,但是不能单独操作主从节点,如果主节点出现故障后会自动切换从节点

现在Redis主节点是192.168.1.119,接下来模拟主节点故障,然后手动进行主从切换

现在主从节点切换完成,原来的主节点变为了从节点,从节点变为了主节点

结论:验证Dify平台功能不受影响,性能几乎也不受影响

2.3. 云数据库RDS

云数据库PostgreSQL实例,使用主备方式部署,同样也不能单独操作主从节点,如果主节点出现故障后会自动切换从节点

现在模拟主节点故障,然后手动进行主从切换,生产环境会自动进行主从切换

点击"是"按钮后会进行主从节点切换

主备切换过程中会导致Dify平台不可用

结论:主备切换完成之后服务恢复正常,验证功能正常,性能不受影响

2.4. 云搜索服务CSS OpenSearch集群

直接对集群进行重启,验证一下重启过程中以及重启后Dify是否有影响

状态显示为"重启中"

结论:验证功能正常,性能不受影响

2.5. 云容器引擎 CCE Turbo集群

CCE Turbo集群是容器的管理工具,最后验证将CCE Turbo集群删除

结论:Dify平台访问无影响,但是聊天交互基本上已无应答,功能受到影响

3. Dify高可用集群测试总结

本篇博文对华为云Dify高可用集群进行的测试,主要验证了高可用系统的稳定性与性能。测试中模拟了节点故障场景,结果显示主备服务节点能够快速切换至备用节点,持续提供服务,验证了高可用架构的有效性。同时,性能测试表明,集群在负载均衡下运行平稳,无明显性能瓶颈。不过在测试中发现部分场景下主从切换过程会导致集群不可用,日志监控输出不够完善。希望加强系统主从切换日志的一些输出,以进一步提升系统的响应速度和可维护性。总体而言,本次测试华为云Dify高可用平台无论是在性能还是稳定性上都能满足企业的开发需求。

相关推荐
zkmall9 分钟前
企业电商解决方案哪家好?ZKmall模块商城全渠道支持 + 定制化服务更省心
大数据·运维·重构·架构·开源
绝不偷吃2 小时前
ELK日志分析系统
运维·elk·jenkins
朱包林3 小时前
day45-nginx复杂跳转与https
linux·运维·服务器·网络·云计算
孙克旭_3 小时前
day045-nginx跳转功能补充与https
linux·运维·nginx·https
Hacker_Oldv5 小时前
软件测试(功能、工具、接口、性能、自动化、测开)详解
运维·自动化
Java樱木5 小时前
使用字节Trae + MCP,UI 到网页自动化。
运维·自动化
无敌暴龙兽z8 小时前
离线环境安装elk及设置密码认证
运维·elk
好奇的菜鸟8 小时前
如何在 Ubuntu 24.04 (Noble) 上使用阿里源
linux·运维·ubuntu
bcbobo21cn9 小时前
初步了解Linux etc/profile文件
linux·运维·服务器·shell·profile
墨风如雪9 小时前
三十亿参数的小宇宙:Ovis-U1-3B,AI界的新晋“全能选手”!
aigc