关系型数据库MySQL(五):Galara高可用

数据库高可用

一、Galera 高可用理论基础

1.1 什么是高可用?

高可用(High Availability, HA)指系统能够持续提供服务的能力,目标是最小化停机时间。在数据库领域,高可用通常通过 冗余节点故障自动转移 实现。

1.2 Galera Cluster 简介

Galera Cluster 是一个基于 MySQL 的 多主同步复制集群,具有以下特点:

  • 多主架构:所有节点均可读写。
  • 强一致性:通过组通信(Group Communication)实现事务同步。
  • 自动故障转移:节点故障时自动重新选举。
  • 无单点故障:所有节点地位平等。
1.3 复制模式对比
复制类型 同步方式 一致性保障 性能影响 适用场景
异步复制 主节点异步推送 跨地域备份
半同步复制 主节点等待从节点 中等 金融交易
组复制(Galera) 事务组提交 中高 高并发多活业务

二、Galera 核心原理

2.1 组通信协议

Galera 使用 组通信系统(GCS) 实现节点间消息传递,常用协议包括:

  • gcomm:Galera 自带的轻量级通信层。
  • Corosync:成熟的集群通信框架。
2.2 事务认证复制

每个事务在提交前需经过集群认证:

  1. 节点 A 发起事务。
  2. 事务写入集(WriteSet)广播至所有节点。
  3. 节点投票是否允许提交。
  4. 多数节点同意后,事务在所有节点提交。
2.3 SST 与 IST
  • SST(State Snapshot Transfer):全量数据同步,用于新节点加入。
  • IST(Incremental State Transfer):增量同步,用于落后节点追数据。

三、OpenEuler 环境部署 Galera 集群

3.1 环境准备
  • 操作系统:OpenEuler 22.03 LTS

  • 节点规划

    • Node1: 192.168.1.101
    • Node2: 192.168.1.102
    • Node3: 192.168.1.103
  • 软件依赖

    bash 复制代码
    sudo dnf install mariadb-server-galera rsync socat
3.2 配置文件详解

编辑 /etc/my.cnf.d/galera.cnf

ini 复制代码
[mysqld]
binlog_format=ROW
default_storage_engine=InnoDB
innodb_autoinc_lock_mode=2
wsrep_on=ON
wsrep_provider=/usr/lib64/galera/libgalera_smm.so
wsrep_cluster_address=gcomm://192.168.1.101,192.168.1.102,192.168.1.103
wsrep_cluster_name=galera_cluster
wsrep_node_address=192.168.1.101  # 当前节点IP
wsrep_node_name=node1             # 节点名称
wsrep_sst_method=rsync            # 同步方法
3.3 启动集群
  1. 初始化第一个节点

    bash 复制代码
    sudo galera_new_cluster
    systemctl start mariadb
  2. 加入其他节点

    bash 复制代码
    systemctl start mariadb
3.4 验证集群状态
sql 复制代码
SHOW STATUS LIKE 'wsrep%';

关键指标:

  • wsrep_cluster_size:集群节点数(应为3)
  • wsrep_local_state_comment:状态("Synced"表示正常)

四、运维实战案例

4.1 节点故障恢复

场景:Node2 宕机后重新加入。

bash 复制代码
# 在 Node2 上
sudo systemctl restart mariadb

观察日志:

log 复制代码
[Note] WSREP: Member 2.0 (node2) requested state transfer from 'node1'
[Note] WSREP: IST receiver started.
4.2 数据一致性验证

测试步骤

  1. 在 Node1 创建表:

    sql 复制代码
    CREATE TABLE test (id INT, name VARCHAR(20));
  2. 在 Node3 插入数据:

    sql 复制代码
    INSERT INTO test VALUES (1, 'Galera');
  3. 在 Node2 查询:

    sql 复制代码
    SELECT * FROM test; -- 应返回 (1, 'Galera')
4.3 脑裂(Split-Brain)处理

预防配置

ini 复制代码
wsrep_provider_options="pc.wait_prim=ON; pc.ignore_sb=OFF"

手动恢复

  1. 关闭所有节点:

    bash 复制代码
    systemctl stop mariadb
  2. 重新引导集群:

    bash 复制代码
    galera_new_cluster # 在主节点执行

五、性能调优与监控

5.1 参数优化
ini 复制代码
# 减少网络延迟影响
wsrep_slave_threads=8
innodb_flush_log_at_trx_commit=2

# 提升 SST 效率
wsrep_sst_method=mariabackup
wsrep_sst_auth="sst_user:password"
5.2 监控工
  • Prometheus + Grafana

    yaml 复制代码
    # prometheus.yml
    scrape_configs:
      - job_name: 'galera'
        static_configs:
          - targets: ['192.168.1.101:9104', '192.168.1.102:9104']
  • 关键指标

    • wsrep_flow_control_paused(流控暂停时间)
    • wsrep_replicated(复制事务数)

六、常见问题排查

6.1 节点无法加入集群

错误日志

log 复制代码
[ERROR] WSREP: Failed to read from: ssl://0.0.0.0:4567

解决方案

  1. 检查防火墙:

    bash 复制代码
    sudo firewall-cmd --add-port=4567/tcp --permanent
  2. 验证 wsrep_cluster_address 配置是否一致。

6.2 SST 失败

错误信息

log 复制代码
[ERROR] WSREP: Process completed with error: wsrep_sst_rsync ...

处理步骤

  1. 确保 rsync 已安装。

  2. 检查目标节点磁盘空间:

    bash 复制代码
    df -h /var/lib/mysql

七、总结

Galera Cluster 为 MySQL 提供了 强一致性多活架构,适合高并发业务场景。在 OpenEuler 系统上需注意:

  • 依赖包兼容性(如 mariadb-server-galera)。
  • 防火墙策略(4567、4444端口)。
  • 定期监控 wsrep 状态指标。

运维口诀

配置一致是基础,网络畅通是关键;

监控指标日日看,脑裂预防记心间。


附录:常用命令速查

bash 复制代码
# 查看集群状态
mysql -e "SHOW STATUS LIKE 'wsrep_cluster_size';"

# 强制移除故障节点
SET GLOBAL wsrep_provider_options='pc.bootstrap=1';
相关推荐
草莓熊Lotso36 分钟前
【Linux网络】UDP Socket 编程全解析:从回显服务到通用字典服务,从零实现工业级代码
linux·运维·服务器·数据库·c++·单片机·udp
woxihuan1234567 小时前
SQL删除数据时存在依赖关系_设置外键级联删除ON DELETE
jvm·数据库·python
东风破1377 小时前
DM8达梦共享存储集群DSC搭建步骤
数据库·学习·dm达梦数据库
雪碧聊技术8 小时前
当数据库字段数大于Java实体类属性数时,MyBatis还能映射成功吗?一文详解
数据库·自动映射·mybatis映射机制·java实体类·宽容映射机制
Jetev8 小时前
如何确定SQL字段是否为空_使用IS NULL与IS NOT NULL
jvm·数据库·python
m0_702036538 小时前
mysql如何处理不走索引的OR查询_使用UNION ALL优化重写
jvm·数据库·python
代钦塔拉8 小时前
Qt4 vs Qt5 带参数信号槽的连接方式详解
开发语言·数据库·qt
2401_846339568 小时前
MySQL在云环境如何选择存储类型_SSD与高性能云盘配置建议
jvm·数据库·python
zhaoyong2229 小时前
SQL如何统计每个用户的首次行为时间_MIN聚合与分组
jvm·数据库·python
2501_9010064710 小时前
C#怎么实现配置热更新 C#如何在运行时动态刷新配置文件不需要重启程序【技巧】
jvm·数据库·python