一、方案背景与技术选型
1.1 为什么需要 MySQL 高可用
在生产环境中,数据库是业务系统的核心基石,一旦 MySQL 服务出现宕机、主库故障等问题,会直接导致业务中断、数据丢失,给企业带来不可估量的损失。因此,搭建一套高可用(High Availability, HA)的 MySQL 集群,是保障业务连续性、实现故障自动切换、数据零丢失的核心需求。
1.2 技术方案选型
本次实战采用MySQL 主从复制 + MHA(Master High Availability)+ Keepalived的经典高可用架构,各组件核心作用如下:
| 组件 | 核心作用 |
|---|---|
| MySQL 主从复制 | 实现主库数据实时同步到从库,保障数据冗余,为故障切换提供数据基础 |
| MHA | 开源 MySQL 高可用管理工具,负责监控主库状态、自动故障检测与主从切换,保障集群可用性 |
| Keepalived | 提供虚拟 IP(VIP),实现故障切换后业务无感知,无需修改应用数据库连接地址 |
1.3 环境规划
本次实战采用 3 节点架构,服务器规划如下:
| 节点角色 | 主机名 | IP 地址 | 核心服务 |
|---|---|---|---|
| 主库(Master) | mysql-master | 192.168.1.100 | MySQL、MHA Node、Keepalived |
| 从库 1(Slave1) | mysql-slave1 | 192.168.1.101 | MySQL、MHA Node、Keepalived |
| 从库 2(Slave2 / 管理节点) | mysql-slave2 | 192.168.1.102 | MySQL、MHA Node、MHA Manager、Keepalived |
| 虚拟 IP(VIP) | - | 192.168.1.200 | 业务访问入口 |
系统环境:CentOS 7.x,MySQL 5.7.x,MHA 0.58,Keepalived 1.3.5
二、前期环境准备(所有节点执行)
2.1 基础环境配置
-
关闭防火墙与 SELinux
# 关闭防火墙 systemctl stop firewalld systemctl disable firewalld # 临时关闭SELinux setenforce 0 # 永久关闭SELinux sed -i 's/SELINUX=enforcing/SELINUX=disabled/' /etc/selinux/config -
配置主机名与 hosts 解析
# 各节点分别设置对应主机名 # Master节点 hostnamectl set-hostname mysql-master # Slave1节点 hostnamectl set-hostname mysql-slave1 # Slave2节点 hostnamectl set-hostname mysql-slave2 # 所有节点配置hosts cat >> /etc/hosts << EOF 192.168.1.100 mysql-master 192.168.1.101 mysql-slave1 192.168.1.102 mysql-slave2 EOF -
配置时间同步
# 安装chrony yum install -y chrony # 配置时间服务器(以阿里云NTP为例) sed -i 's/^server/#server/' /etc/chrony.conf cat >> /etc/chrony.conf << EOF server ntp.aliyun.com iburst EOF # 启动服务 systemctl start chronyd systemctl enable chronyd # 验证时间同步 timedatectl -
配置 SSH 免密登录(MHA 节点间通信必备)
# 所有节点生成密钥 ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa # 所有节点将公钥发送到其他节点(包含自身) ssh-copy-id root@mysql-master ssh-copy-id root@mysql-slave1 ssh-copy-id root@mysql-slave2 # 验证免密登录 ssh mysql-slave2 "date"
2.2 安装 MySQL 数据库(所有节点执行)
-
卸载系统自带 MariaDB
yum remove -y mariadb* -
配置 MySQL YUM 源
wget https://dev.mysql.com/get/mysql57-community-release-el7-11.noarch.rpm rpm -ivh mysql57-community-release-el7-11.noarch.rpm -
安装 MySQL 5.7
yum install -y mysql-community-server -
启动 MySQL 并初始化
systemctl start mysqld systemctl enable mysqld # 获取初始密码 grep 'temporary password' /var/log/mysqld.log # 登录MySQL修改初始密码 mysql -uroot -p ALTER USER 'root'@'localhost' IDENTIFIED BY 'MyNewPass@123'; -
配置 MySQL 主从复制参数(所有节点修改 my.cnf)
cat >> /etc/my.cnf << EOF [mysqld] # 基础配置 server-id=1 # 主库为1,从库1为2,从库2为3,必须唯一 log-bin=mysql-bin binlog_format=ROW # 主从复制优化 relay_log=relay-bin read_only=1 # 从库开启只读,主库无需配置 log_slave_updates=1 # 字符集配置 character-set-server=utf8mb4 collation-server=utf8mb4_general_ci # 慢查询日志 slow_query_log=1 long_query_time=2 EOF注意:主库需删除
read_only=1配置,重启 MySQL 生效systemctl restart mysqld
三、配置 MySQL 主从复制
3.1 主库配置(mysql-master)
-
创建主从复制账号
-- 登录主库MySQL mysql -uroot -pMyNewPass@123 -- 创建复制账号,授权所有从库访问 CREATE USER 'repl'@'%' IDENTIFIED BY 'Repl@123456'; GRANT REPLICATION SLAVE ON *.* TO 'repl'@'%'; FLUSH PRIVILEGES; -- 查看主库binlog信息(记录File和Position) SHOW MASTER STATUS\G输出示例:
*************************** 1. row *************************** File: mysql-bin.000001 Position: 154 Binlog_Do_DB: Binlog_Ignore_DB: Executed_Gtid_Set:
3.2 从库配置(mysql-slave1、mysql-slave2)
-
配置主从同步
-- 登录从库MySQL mysql -uroot -pMyNewPass@123 -- 配置主库信息,替换为实际主库IP、binlog File和Position CHANGE MASTER TO MASTER_HOST='192.168.1.100', MASTER_USER='repl', MASTER_PASSWORD='Repl@123456', MASTER_LOG_FILE='mysql-bin.000001', MASTER_LOG_POS=154; -- 启动从库复制 START SLAVE; -- 查看复制状态 SHOW SLAVE STATUS\G验证标准:
Slave_IO_Running: Yes、Slave_SQL_Running: Yes,代表主从同步正常
四、安装配置 MHA 高可用
4.1 安装 MHA 依赖(所有节点执行)
# 安装依赖包
yum install -y perl-DBD-MySQL perl-Config-Tiny perl-Log-Dispatch perl-Parallel-ForkManager perl-Time-HiRes
4.2 安装 MHA Node(所有节点执行)
# 下载MHA Node安装包
wget https://github.com/yoshinorim/mha4mysql-node/releases/download/v0.58/mha4mysql-node-0.58-0.el7.noarch.rpm
# 安装
rpm -ivh mha4mysql-node-0.58-0.el7.noarch.rpm
4.3 安装 MHA Manager(仅管理节点 mysql-slave2 执行)
# 下载MHA Manager安装包
wget https://github.com/yoshinorim/mha4mysql-manager/releases/download/v0.58/mha4mysql-manager-0.58-0.el7.noarch.rpm
# 安装
rpm -ivh mha4mysql-manager-0.58-0.el7.noarch.rpm
4.4 配置 MHA Manager(管理节点 mysql-slave2)
-
创建 MHA 工作目录
mkdir -p /etc/mha mkdir -p /var/log/mha chown -R mysql:mysql /etc/mha /var/log/mha -
创建 MHA 配置文件
/etc/mha/mha.cnf[server default] # MySQL管理员账号 user=root password=MyNewPass@123 # 主从复制账号 repl_user=repl repl_password=Repl@123456 # 工作目录 manager_workdir=/var/log/mha manager_log=/var/log/mha/manager.log remote_workdir=/var/log/mha # 远程SSH用户 ssh_user=root # 故障切换脚本(后续配置Keepalived联动) # master_ip_failover_script=/etc/mha/master_ip_failover # 从库提升为主库后执行脚本 # master_ip_online_change_script=/etc/mha/master_ip_online_change # 监控间隔(秒) ping_interval=1 [server1] hostname=mysql-master candidate_master=1 # 优先候选主库 port=3306 [server2] hostname=mysql-slave1 candidate_master=1 port=3306 [server3] hostname=mysql-slave2 no_master=1 # 不参与主库选举,仅作为从库 port=3306 -
验证 MHA 配置
# 验证SSH免密 masterha_check_ssh --conf=/etc/mha/mha.cnf # 验证主从复制 masterha_check_repl --conf=/etc/mha/mha.cnf验证成功标准:输出
All SSH connection tests passed successfully.和MySQL Replication Health is OK. -
启动 MHA Manager 服务
# 后台启动 nohup masterha_manager --conf=/etc/mha/mha.cnf &> /var/log/mha/manager.log & # 查看MHA状态 masterha_check_status --conf=/etc/mha/mha.cnf正常状态:
mysql-slave2 (pid: 12345) is running(0:PING_OK)
五、安装配置 Keepalived 实现 VIP
5.1 安装 Keepalived(所有节点执行)
yum install -y keepalived
systemctl enable keepalived
5.2 配置 Keepalived(主库 mysql-master)
创建配置文件/etc/keepalived/keepalived.conf
global_defs {
router_id mysql-master
}
vrrp_instance VI_1 {
state MASTER
interface ens33 # 替换为实际网卡名称
virtual_router_id 51
priority 150 # 主库优先级最高
advert_int 1
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
192.168.1.200/24 # 虚拟IP
}
}
5.3 配置 Keepalived(从库 mysql-slave1、mysql-slave2)
创建配置文件/etc/keepalived/keepalived.conf
global_defs {
router_id mysql-slave1 # 从库2改为mysql-slave2
}
vrrp_instance VI_1 {
state BACKUP
interface ens33 # 替换为实际网卡名称
virtual_router_id 51
priority 100 # 从库优先级低于主库
advert_int 1
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
192.168.1.200/24 # 虚拟IP
}
}
5.4 启动 Keepalived 服务
# 所有节点启动服务
systemctl start keepalived
# 查看VIP(主库节点可看到VIP)
ip addr show ens33
5.5 配置 MHA 与 Keepalived 联动(可选,实现故障自动切换 VIP)
-
创建 VIP 切换脚本
/etc/mha/master_ip_failover#!/usr/bin/env perl use strict; use warnings FATAL => 'all'; use Getopt::Long; my ( $command, $ssh_user, $orig_master_host, $orig_master_ip, $orig_master_port, $new_master_host, $new_master_ip, $new_master_port ); my $vip = '192.168.1.200/24'; my $key = '0'; my $ssh_start_vip = "/usr/sbin/ip addr add $vip dev ens33"; my $ssh_stop_vip = "/usr/sbin/ip addr del $vip dev ens33"; GetOptions( 'command=s' => \$command, 'ssh_user=s' => \$ssh_user, 'orig_master_host=s' => \$orig_master_host, 'orig_master_ip=s' => \$orig_master_ip, 'orig_master_port=i' => \$orig_master_port, 'new_master_host=s' => \$new_master_host, 'new_master_ip=s' => \$new_master_ip, 'new_master_port=i' => \$new_master_port, ); exit &main(); sub main { if ( $command eq "stop" || $command eq "stopssh" ) { my $exit_code = 1; eval { print "Disabling the VIP on old master: $orig_master_host \n"; &stop_vip(); $exit_code = 0; }; if ($@) { warn "Got Error: $@\n"; exit $exit_code; } exit $exit_code; } elsif ( $command eq "start" ) { my $exit_code = 1; eval { print "Enabling the VIP - $vip on the new master - $new_master_host \n"; &start_vip(); $exit_code = 0; }; if ($@) { warn $@; exit $exit_code; } exit $exit_code; } elsif ( $command eq "status" ) { print "Checking the Status of the script.. OK \n"; exit 0; } else { &usage(); exit 1; } } sub start_vip() { `ssh $ssh_user\@$new_master_host \" $ssh_start_vip \"`; } sub stop_vip() { return 0 unless ($ssh_user); `ssh $ssh_user\@$orig_master_host \" $ssh_stop_vip \"`; } sub usage { print "Usage: master_ip_failover --command=start|stop|stopssh|status --ssh_user=user --orig_master_host=host --orig_master_ip=ip --orig_master_port=port --new_master_host=host --new_master_ip=ip --new_master_port=port\n"; } -
赋予脚本执行权限
chmod +x /etc/mha/master_ip_failover chown mysql:mysql /etc/mha/master_ip_failover -
修改 MHA 配置文件,启用切换脚本
[server default] master_ip_failover_script=/etc/mha/master_ip_failover -
重启 MHA Manager 服务
masterha_stop --conf=/etc/mha/mha.cnf nohup masterha_manager --conf=/etc/mha/mha.cnf &> /var/log/mha/manager.log &
六、高可用集群验证
6.1 主从同步验证
-
主库创建测试数据
CREATE DATABASE test_db; USE test_db; CREATE TABLE test_table (id INT AUTO_INCREMENT PRIMARY KEY, name VARCHAR(20)); INSERT INTO test_table (name) VALUES ('test1'), ('test2'); -
从库查询数据,验证同步正常
SELECT * FROM test_db.test_table;
6.2 故障切换验证
-
模拟主库宕机
# 主库节点执行,停止MySQL服务 systemctl stop mysqld -
查看 MHA 日志
tail -f /var/log/mha/manager.log日志会显示:检测到主库故障 -> 选举新主库 -> 执行主从切换 -> 同步 VIP 到新主库
-
验证 VIP 漂移
# 原主库节点:VIP消失 ip addr show ens33 # 新主库节点:VIP成功漂移 ip addr show ens33 -
验证业务访问通过 VIP 192.168.1.200 访问数据库,验证数据正常、业务无感知
七、运维注意事项与优化
7.1 日常运维要点
-
定期监控集群状态
# 查看MHA状态 masterha_check_status --conf=/etc/mha/mha.cnf # 查看主从复制状态 mysql -uroot -p -e "SHOW SLAVE STATUS\G" # 查看Keepalived状态 systemctl status keepalived -
主库故障恢复后处理原主库修复后,需重新加入集群作为从库,避免脑裂:
-- 原主库登录MySQL,重置主从 RESET MASTER; CHANGE MASTER TO MASTER_HOST='新主库IP', MASTER_USER='repl', MASTER_PASSWORD='Repl@123456', MASTER_LOG_FILE='mysql-bin.000001', MASTER_LOG_POS=154; START SLAVE; -
定期备份数据配置定时任务,每日全量备份 + 增量备份,保障数据安全。
7.2 性能优化建议
-
主从复制优化
- 开启半同步复制,避免主从数据不一致
- 调整
innodb_flush_log_at_trx_commit=1、sync_binlog=1,保障数据安全 - 从库开启并行复制,提升同步效率
-
MHA 优化
- 调整
ping_interval参数,缩短故障检测时间 - 配置邮件告警,故障时及时通知运维人员
- 调整
-
Keepalived 优化
- 配置多网卡绑定,避免单点故障
- 调整优先级,实现主库恢复后自动切回
八、总结
本文详细介绍了基于 MySQL+MHA+Keepalived 搭建高可用主从集群的完整流程,从环境准备、主从配置、MHA 部署到 Keepalived 联动,覆盖了生产环境中 MySQL 高可用的核心需求。该架构具备以下优势:
- 高可用性:主库故障自动切换,RTO<30 秒,业务无感知
- 数据可靠性:主从实时同步,保障数据零丢失
- 可扩展性:支持横向扩展从库,提升读性能
- 运维便捷性:MHA 自动化管理,降低运维成本-