MySQL 高可用集群搭建(GTID 模式 + 自动故障转移)
一、环境规划
角色 | IP 地址 | 说明 |
---|---|---|
主库 (Master) | 192.168.1.100 | 运行 MySQL + Keepalived/MHA |
从库1 (Slave1) | 192.168.1.101 | 运行 MySQL + Keepalived/MHA |
从库2 (Slave2) | 192.168.1.102 | 运行 MySQL |
虚拟 IP (VIP) | 192.168.1.200 | 客户端访问入口 |
二、配置 GTID 主从同步
1. 所有节点配置 MySQL
# 编辑配置文件(MySQL 8.0)
sudo vim /etc/mysql/mysql.conf.d/mysqld.cnf
mysqld
# 通用配置
server-id = 1 # 主库设为 1,从库依次递增(2, 3...)
log_bin = /var/log/mysql/mysql-bin.log
binlog_format = ROW
expire_logs_days = 7
# GTID 配置
gtid_mode = ON # 启用 GTID
enforce_gtid_consistency = ON # 强制 GTID 一致性
log_slave_updates = ON # 从库记录 binlog(级联复制必需)
# 重启 MySQL
sudo systemctl restart mysql
2. 主库操作
-- 创建复制专用用户
CREATE USER 'repl'@'192.168.1.%' IDENTIFIED BY 'SecurePass123!';
GRANT REPLICATION SLAVE ON *.* TO 'repl'@'192.168.1.%';
FLUSH PRIVILEGES;
-- 查看 GTID 状态
SHOW MASTER STATUS\G
-- 输出示例:
-- File: mysql-bin.000001
-- Position: 154
-- Executed_Gtid_Set: 3E11FA47-71CA-11E1-9E33-C80AA9429562:1-5
3. 从库操作
-- 配置主库信息(所有从库执行)
CHANGE MASTER TO
MASTER_HOST = '192.168.1.100',
MASTER_USER = 'repl',
MASTER_PASSWORD = 'SecurePass123!',
MASTER_AUTO_POSITION = 1; -- GTID 模式自动同步位置
-- 启动复制
START SLAVE;
-- 检查复制状态
SHOW SLAVE STATUS\G
-- 关键指标:
-- Slave_IO_Running: Yes
-- Slave_SQL_Running: Yes
-- Retrieved_Gtid_Set: 3E11FA47-71CA-11E1-9E33-C80AA9429562:1-5
-- Executed_Gtid_Set: 3E11FA47-71CA-11E1-9E33-C80AA9429562:1-5
三、自动故障转移方案
方案 1:Keepalived + VIP(快速切换)
1. 安装 Keepalived(主库和从库1)
# Ubuntu/Debian
sudo apt install keepalived
# CentOS/RHEL
sudo yum install keepalived
2. 主库 Keepalived 配置
sudo vim /etc/keepalived/keepalived.conf
vrrp_script chk_mysql {
script "/usr/bin/pgrep mysqld" # 检查 MySQL 进程
interval 2
weight 2
}
vrrp_instance VI_1 {
state MASTER
interface eth0
virtual_router_id 51
priority 100 # 主库优先级更高
advert_int 1
authentication {
auth_type PASS
auth_pass 1234
}
virtual_ipaddress {
192.168.1.200/24 # 虚拟 IP
}
track_script {
chk_mysql
}
}
3. 从库 Keepalived 配置
sudo vim /etc/keepalived/keepalived.conf
vrrp_instance VI_1 {
state BACKUP
interface eth0
virtual_router_id 51
priority 50 # 优先级低于主库
advert_int 1
authentication {
auth_type PASS
auth_pass 1234
}
virtual_ipaddress {
192.168.1.200/24
}
track_script {
chk_mysql
}
}
4. 启动并验证
sudo systemctl restart keepalived
sudo systemctl enable keepalived
# 检查 VIP 绑定
ip addr show eth0 | grep 192.168.1.200
方案 2:MHA(智能故障转移)
1. 所有节点配置 SSH 免密登录
# 在 MHA Manager 节点执行
ssh-keygen -t rsa
ssh-copy-id [email protected]
ssh-copy-id [email protected]
ssh-copy-id [email protected]
2. 安装 MHA Node(所有 MySQL 节点)
# Ubuntu/Debian
sudo apt install mha4mysql-node
# CentOS/RHEL
sudo yum install https://github.com/yoshinorim/mha4mysql-node/releases/download/v0.58/mha4mysql-node-0.58-0.el7.noarch.rpm
3. 安装 MHA Manager(管理节点)
# Ubuntu/Debian
sudo apt install mha4mysql-manager
# CentOS/RHEL
sudo yum install https://github.com/yoshinorim/mha4mysql-manager/releases/download/v0.58/mha4mysql-manager-0.58-0.el7.noarch.rpm
4. 配置 MHA
sudo mkdir -p /etc/mha
sudo vim /etc/mha/app1.cnf
server default
manager_workdir=/var/log/mha/app1
manager_log=/var/log/mha/app1/manager.log
ssh_user=root
repl_user=repl
repl_password=SecurePass123!
ping_interval=3
server1
hostname=192.168.1.100
candidate_master=1
server2
hostname=192.168.1.101
candidate_master=1
server3
hostname=192.168.1.102
5. 启动 MHA
masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover
# 检查状态
masterha_check_status --conf=/etc/mha/app1.cnf
四、数据备份与恢复(GTID 模式)
1. 全量备份
# 使用 mysqldump(主库执行)
mysqldump -u root -p --all-databases --single-transaction --set-gtid-purged=ON > full_backup_$(date +%Y%m%d).sql
2. 增量备份
-- 定期记录 GTID 集合
SHOW GLOBAL VARIABLES LIKE 'gtid_executed';
-- 示例输出:3E11FA47-71CA-11E1-9E33-C80AA9429562:1-1000
-- 增量备份时导出新增 GTID 区间
mysqlbinlog --include-gtids='3E11FA47-71CA-11E1-9E33-C80AA9429562:1001-2000' /var/log/mysql/mysql-bin.00000* > incremental_backup.sql
3. 数据恢复
# 全量恢复
mysql -u root -p < full_backup_20231001.sql
# 增量恢复
mysql -u root -p < incremental_backup.sql
五、主从切换操作
1. 手动切换(GTID 模式)
-- 在目标从库执行
STOP SLAVE;
RESET SLAVE ALL;
-- 提升为新主库
SET GLOBAL read_only = OFF;
-- 其他从库指向新主库
CHANGE MASTER TO
MASTER_HOST='192.168.1.101',
MASTER_USER='repl',
MASTER_PASSWORD='SecurePass123!',
MASTER_AUTO_POSITION=1;
START SLAVE;
六、验证与监控
1. 检查 GTID 一致性
-- 所有节点执行
SHOW GLOBAL VARIABLES LIKE 'gtid_executed';
-- 确保所有节点 GTID 集合相同
2. 监控复制延迟
SHOW SLAVE STATUS\G
-- 关注 Seconds_Behind_Master
3. 日志检查
# Keepalived 日志
journalctl -u keepalived
# MHA 日志
tail -f /var/log/mha/app1/manager.log
七、故障排查命令
1. 主从复制中断
-- 查看错误原因
SHOW SLAVE STATUS\G
-- 跳过错误(谨慎操作)
STOP SLAVE;
SET GTID_NEXT='3E11FA47-71CA-11E1-9E33-C80AA9429562:1001';
BEGIN; COMMIT;
SET GTID_NEXT='AUTOMATIC';
START SLAVE;
2. VIP 未漂移
# 检查 Keepalived 进程
ps aux | grep keepalived
# 手动释放 VIP
systemctl restart keepalived
八、关键注意事项
- GTID 限制:
- 禁止直接修改 gtid_purged,可能导致数据冲突。
- 所有事务必须通过 GTID 复制,禁用非 GTID 操作(如 CHANGE MASTER TO MASTER_LOG_FILE)。
- 备份策略:
- 全量备份每日一次,增量备份每小时一次。
- 使用 Percona XtraBackup 替代 mysqldump 支持热备份:
xtrabackup --backup --target-dir=/backup/xtrabackup/full
- 安全加固:
- 限制复制用户 IP 范围(如 repl'@'192.168.1.%')。
- 加密备份文件并存储到远程服务器。
通过以上步骤,您将获得一个基于 GTID + Keepalived/MHA 的高可用 MySQL 集群,支持自动故障转移、数据一致性保障和快速恢复。