基于 MySQL+MHA+Keepalived 搭建高可用主从集群实战

一、方案背景与技术选型

1.1 为什么需要 MySQL 高可用

在生产环境中,数据库是业务系统的核心基石,一旦 MySQL 服务出现宕机、主库故障等问题,会直接导致业务中断、数据丢失,给企业带来不可估量的损失。因此,搭建一套高可用(High Availability, HA)的 MySQL 集群,是保障业务连续性、实现故障自动切换、数据零丢失的核心需求。

1.2 技术方案选型

本次实战采用MySQL 主从复制 + MHA(Master High Availability)+ Keepalived的经典高可用架构,各组件核心作用如下:

组件 核心作用
MySQL 主从复制 实现主库数据实时同步到从库,保障数据冗余,为故障切换提供数据基础
MHA 开源 MySQL 高可用管理工具,负责监控主库状态、自动故障检测与主从切换,保障集群可用性
Keepalived 提供虚拟 IP(VIP),实现故障切换后业务无感知,无需修改应用数据库连接地址

1.3 环境规划

本次实战采用 3 节点架构,服务器规划如下:

节点角色 主机名 IP 地址 核心服务
主库(Master) mysql-master 192.168.1.100 MySQL、MHA Node、Keepalived
从库 1(Slave1) mysql-slave1 192.168.1.101 MySQL、MHA Node、Keepalived
从库 2(Slave2 / 管理节点) mysql-slave2 192.168.1.102 MySQL、MHA Node、MHA Manager、Keepalived
虚拟 IP(VIP) - 192.168.1.200 业务访问入口

系统环境:CentOS 7.x,MySQL 5.7.x,MHA 0.58,Keepalived 1.3.5


二、前期环境准备(所有节点执行)

2.1 基础环境配置

  1. 关闭防火墙与 SELinux

    复制代码
    # 关闭防火墙
    systemctl stop firewalld
    systemctl disable firewalld
    # 临时关闭SELinux
    setenforce 0
    # 永久关闭SELinux
    sed -i 's/SELINUX=enforcing/SELINUX=disabled/' /etc/selinux/config
  2. 配置主机名与 hosts 解析

    复制代码
    # 各节点分别设置对应主机名
    # Master节点
    hostnamectl set-hostname mysql-master
    # Slave1节点
    hostnamectl set-hostname mysql-slave1
    # Slave2节点
    hostnamectl set-hostname mysql-slave2
    
    # 所有节点配置hosts
    cat >> /etc/hosts << EOF
    192.168.1.100 mysql-master
    192.168.1.101 mysql-slave1
    192.168.1.102 mysql-slave2
    EOF
  3. 配置时间同步

    复制代码
    # 安装chrony
    yum install -y chrony
    # 配置时间服务器(以阿里云NTP为例)
    sed -i 's/^server/#server/' /etc/chrony.conf
    cat >> /etc/chrony.conf << EOF
    server ntp.aliyun.com iburst
    EOF
    # 启动服务
    systemctl start chronyd
    systemctl enable chronyd
    # 验证时间同步
    timedatectl
  4. 配置 SSH 免密登录(MHA 节点间通信必备)

    复制代码
    # 所有节点生成密钥
    ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
    # 所有节点将公钥发送到其他节点(包含自身)
    ssh-copy-id root@mysql-master
    ssh-copy-id root@mysql-slave1
    ssh-copy-id root@mysql-slave2
    # 验证免密登录
    ssh mysql-slave2 "date"

2.2 安装 MySQL 数据库(所有节点执行)

  1. 卸载系统自带 MariaDB

    复制代码
    yum remove -y mariadb*
  2. 配置 MySQL YUM 源

    复制代码
    wget https://dev.mysql.com/get/mysql57-community-release-el7-11.noarch.rpm
    rpm -ivh mysql57-community-release-el7-11.noarch.rpm
  3. 安装 MySQL 5.7

    复制代码
    yum install -y mysql-community-server
  4. 启动 MySQL 并初始化

    复制代码
    systemctl start mysqld
    systemctl enable mysqld
    # 获取初始密码
    grep 'temporary password' /var/log/mysqld.log
    # 登录MySQL修改初始密码
    mysql -uroot -p
    ALTER USER 'root'@'localhost' IDENTIFIED BY 'MyNewPass@123';
  5. 配置 MySQL 主从复制参数(所有节点修改 my.cnf)

    复制代码
    cat >> /etc/my.cnf << EOF
    [mysqld]
    # 基础配置
    server-id=1  # 主库为1,从库1为2,从库2为3,必须唯一
    log-bin=mysql-bin
    binlog_format=ROW
    # 主从复制优化
    relay_log=relay-bin
    read_only=1  # 从库开启只读,主库无需配置
    log_slave_updates=1
    # 字符集配置
    character-set-server=utf8mb4
    collation-server=utf8mb4_general_ci
    # 慢查询日志
    slow_query_log=1
    long_query_time=2
    EOF

    注意:主库需删除read_only=1配置,重启 MySQL 生效

    复制代码
    systemctl restart mysqld

三、配置 MySQL 主从复制

3.1 主库配置(mysql-master)

  1. 创建主从复制账号

    复制代码
    -- 登录主库MySQL
    mysql -uroot -pMyNewPass@123
    -- 创建复制账号,授权所有从库访问
    CREATE USER 'repl'@'%' IDENTIFIED BY 'Repl@123456';
    GRANT REPLICATION SLAVE ON *.* TO 'repl'@'%';
    FLUSH PRIVILEGES;
    -- 查看主库binlog信息(记录File和Position)
    SHOW MASTER STATUS\G

    输出示例:

    复制代码
    *************************** 1. row ***************************
                  File: mysql-bin.000001
              Position: 154
              Binlog_Do_DB:
          Binlog_Ignore_DB:
    Executed_Gtid_Set:

3.2 从库配置(mysql-slave1、mysql-slave2)

  1. 配置主从同步

    复制代码
    -- 登录从库MySQL
    mysql -uroot -pMyNewPass@123
    -- 配置主库信息,替换为实际主库IP、binlog File和Position
    CHANGE MASTER TO
    MASTER_HOST='192.168.1.100',
    MASTER_USER='repl',
    MASTER_PASSWORD='Repl@123456',
    MASTER_LOG_FILE='mysql-bin.000001',
    MASTER_LOG_POS=154;
    -- 启动从库复制
    START SLAVE;
    -- 查看复制状态
    SHOW SLAVE STATUS\G

    验证标准:Slave_IO_Running: YesSlave_SQL_Running: Yes,代表主从同步正常


四、安装配置 MHA 高可用

4.1 安装 MHA 依赖(所有节点执行)

复制代码
# 安装依赖包
yum install -y perl-DBD-MySQL perl-Config-Tiny perl-Log-Dispatch perl-Parallel-ForkManager perl-Time-HiRes

4.2 安装 MHA Node(所有节点执行)

复制代码
# 下载MHA Node安装包
wget https://github.com/yoshinorim/mha4mysql-node/releases/download/v0.58/mha4mysql-node-0.58-0.el7.noarch.rpm
# 安装
rpm -ivh mha4mysql-node-0.58-0.el7.noarch.rpm

4.3 安装 MHA Manager(仅管理节点 mysql-slave2 执行)

复制代码
# 下载MHA Manager安装包
wget https://github.com/yoshinorim/mha4mysql-manager/releases/download/v0.58/mha4mysql-manager-0.58-0.el7.noarch.rpm
# 安装
rpm -ivh mha4mysql-manager-0.58-0.el7.noarch.rpm

4.4 配置 MHA Manager(管理节点 mysql-slave2)

  1. 创建 MHA 工作目录

    复制代码
    mkdir -p /etc/mha
    mkdir -p /var/log/mha
    chown -R mysql:mysql /etc/mha /var/log/mha
  2. 创建 MHA 配置文件/etc/mha/mha.cnf

    复制代码
    [server default]
    # MySQL管理员账号
    user=root
    password=MyNewPass@123
    # 主从复制账号
    repl_user=repl
    repl_password=Repl@123456
    # 工作目录
    manager_workdir=/var/log/mha
    manager_log=/var/log/mha/manager.log
    remote_workdir=/var/log/mha
    # 远程SSH用户
    ssh_user=root
    # 故障切换脚本(后续配置Keepalived联动)
    # master_ip_failover_script=/etc/mha/master_ip_failover
    # 从库提升为主库后执行脚本
    # master_ip_online_change_script=/etc/mha/master_ip_online_change
    # 监控间隔(秒)
    ping_interval=1
    
    [server1]
    hostname=mysql-master
    candidate_master=1  # 优先候选主库
    port=3306
    
    [server2]
    hostname=mysql-slave1
    candidate_master=1
    port=3306
    
    [server3]
    hostname=mysql-slave2
    no_master=1  # 不参与主库选举,仅作为从库
    port=3306
  3. 验证 MHA 配置

    复制代码
    # 验证SSH免密
    masterha_check_ssh --conf=/etc/mha/mha.cnf
    # 验证主从复制
    masterha_check_repl --conf=/etc/mha/mha.cnf

    验证成功标准:输出All SSH connection tests passed successfully.MySQL Replication Health is OK.

  4. 启动 MHA Manager 服务

    复制代码
    # 后台启动
    nohup masterha_manager --conf=/etc/mha/mha.cnf &> /var/log/mha/manager.log &
    # 查看MHA状态
    masterha_check_status --conf=/etc/mha/mha.cnf

    正常状态:mysql-slave2 (pid: 12345) is running(0:PING_OK)


五、安装配置 Keepalived 实现 VIP

5.1 安装 Keepalived(所有节点执行)

复制代码
yum install -y keepalived
systemctl enable keepalived

5.2 配置 Keepalived(主库 mysql-master)

创建配置文件/etc/keepalived/keepalived.conf

复制代码
global_defs {
    router_id mysql-master
}

vrrp_instance VI_1 {
    state MASTER
    interface ens33  # 替换为实际网卡名称
    virtual_router_id 51
    priority 150  # 主库优先级最高
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1111
    }
    virtual_ipaddress {
        192.168.1.200/24  # 虚拟IP
    }
}

5.3 配置 Keepalived(从库 mysql-slave1、mysql-slave2)

创建配置文件/etc/keepalived/keepalived.conf

复制代码
global_defs {
    router_id mysql-slave1  # 从库2改为mysql-slave2
}

vrrp_instance VI_1 {
    state BACKUP
    interface ens33  # 替换为实际网卡名称
    virtual_router_id 51
    priority 100  # 从库优先级低于主库
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1111
    }
    virtual_ipaddress {
        192.168.1.200/24  # 虚拟IP
    }
}

5.4 启动 Keepalived 服务

复制代码
# 所有节点启动服务
systemctl start keepalived
# 查看VIP(主库节点可看到VIP)
ip addr show ens33

5.5 配置 MHA 与 Keepalived 联动(可选,实现故障自动切换 VIP)

  1. 创建 VIP 切换脚本/etc/mha/master_ip_failover

    复制代码
    #!/usr/bin/env perl
    use strict;
    use warnings FATAL => 'all';
    
    use Getopt::Long;
    
    my (
        $command,          $ssh_user,        $orig_master_host, $orig_master_ip,
        $orig_master_port, $new_master_host, $new_master_ip,    $new_master_port
    );
    
    my $vip = '192.168.1.200/24';
    my $key = '0';
    my $ssh_start_vip = "/usr/sbin/ip addr add $vip dev ens33";
    my $ssh_stop_vip = "/usr/sbin/ip addr del $vip dev ens33";
    
    GetOptions(
        'command=s'          => \$command,
        'ssh_user=s'         => \$ssh_user,
        'orig_master_host=s' => \$orig_master_host,
        'orig_master_ip=s'   => \$orig_master_ip,
        'orig_master_port=i' => \$orig_master_port,
        'new_master_host=s' => \$new_master_host,
        'new_master_ip=s'   => \$new_master_ip,
        'new_master_port=i' => \$new_master_port,
    );
    
    exit &main();
    
    sub main {
        if ( $command eq "stop" || $command eq "stopssh" ) {
            my $exit_code = 1;
            eval {
                print "Disabling the VIP on old master: $orig_master_host \n";
                &stop_vip();
                $exit_code = 0;
            };
            if ($@) {
                warn "Got Error: $@\n";
                exit $exit_code;
            }
            exit $exit_code;
        }
        elsif ( $command eq "start" ) {
            my $exit_code = 1;
            eval {
                print "Enabling the VIP - $vip on the new master - $new_master_host \n";
                &start_vip();
                $exit_code = 0;
            };
            if ($@) {
                warn $@;
                exit $exit_code;
            }
            exit $exit_code;
        }
        elsif ( $command eq "status" ) {
            print "Checking the Status of the script.. OK \n";
            exit 0;
        }
        else {
            &usage();
            exit 1;
        }
    }
    
    sub start_vip() {
        `ssh $ssh_user\@$new_master_host \" $ssh_start_vip \"`;
    }
    sub stop_vip() {
        return 0 unless ($ssh_user);
        `ssh $ssh_user\@$orig_master_host \" $ssh_stop_vip \"`;
    }
    
    sub usage {
        print
        "Usage: master_ip_failover --command=start|stop|stopssh|status --ssh_user=user --orig_master_host=host --orig_master_ip=ip --orig_master_port=port --new_master_host=host --new_master_ip=ip --new_master_port=port\n";
    }
  2. 赋予脚本执行权限

    复制代码
    chmod +x /etc/mha/master_ip_failover
    chown mysql:mysql /etc/mha/master_ip_failover
  3. 修改 MHA 配置文件,启用切换脚本

    复制代码
    [server default]
    master_ip_failover_script=/etc/mha/master_ip_failover
  4. 重启 MHA Manager 服务

    复制代码
    masterha_stop --conf=/etc/mha/mha.cnf
    nohup masterha_manager --conf=/etc/mha/mha.cnf &> /var/log/mha/manager.log &

六、高可用集群验证

6.1 主从同步验证

  1. 主库创建测试数据

    复制代码
    CREATE DATABASE test_db;
    USE test_db;
    CREATE TABLE test_table (id INT AUTO_INCREMENT PRIMARY KEY, name VARCHAR(20));
    INSERT INTO test_table (name) VALUES ('test1'), ('test2');
  2. 从库查询数据,验证同步正常

    复制代码
    SELECT * FROM test_db.test_table;

6.2 故障切换验证

  1. 模拟主库宕机

    复制代码
    # 主库节点执行,停止MySQL服务
    systemctl stop mysqld
  2. 查看 MHA 日志

    复制代码
    tail -f /var/log/mha/manager.log

    日志会显示:检测到主库故障 -> 选举新主库 -> 执行主从切换 -> 同步 VIP 到新主库

  3. 验证 VIP 漂移

    复制代码
    # 原主库节点:VIP消失
    ip addr show ens33
    # 新主库节点:VIP成功漂移
    ip addr show ens33
  4. 验证业务访问通过 VIP 192.168.1.200 访问数据库,验证数据正常、业务无感知


七、运维注意事项与优化

7.1 日常运维要点

  1. 定期监控集群状态

    复制代码
    # 查看MHA状态
    masterha_check_status --conf=/etc/mha/mha.cnf
    # 查看主从复制状态
    mysql -uroot -p -e "SHOW SLAVE STATUS\G"
    # 查看Keepalived状态
    systemctl status keepalived
  2. 主库故障恢复后处理原主库修复后,需重新加入集群作为从库,避免脑裂:

    复制代码
    -- 原主库登录MySQL,重置主从
    RESET MASTER;
    CHANGE MASTER TO MASTER_HOST='新主库IP', MASTER_USER='repl', MASTER_PASSWORD='Repl@123456', MASTER_LOG_FILE='mysql-bin.000001', MASTER_LOG_POS=154;
    START SLAVE;
  3. 定期备份数据配置定时任务,每日全量备份 + 增量备份,保障数据安全。

7.2 性能优化建议

  1. 主从复制优化

    • 开启半同步复制,避免主从数据不一致
    • 调整innodb_flush_log_at_trx_commit=1sync_binlog=1,保障数据安全
    • 从库开启并行复制,提升同步效率
  2. MHA 优化

    • 调整ping_interval参数,缩短故障检测时间
    • 配置邮件告警,故障时及时通知运维人员
  3. Keepalived 优化

    • 配置多网卡绑定,避免单点故障
    • 调整优先级,实现主库恢复后自动切回

八、总结

本文详细介绍了基于 MySQL+MHA+Keepalived 搭建高可用主从集群的完整流程,从环境准备、主从配置、MHA 部署到 Keepalived 联动,覆盖了生产环境中 MySQL 高可用的核心需求。该架构具备以下优势:

  • 高可用性:主库故障自动切换,RTO<30 秒,业务无感知
  • 数据可靠性:主从实时同步,保障数据零丢失
  • 可扩展性:支持横向扩展从库,提升读性能
  • 运维便捷性:MHA 自动化管理,降低运维成本-
相关推荐
imuliuliang4 小时前
Java MySQL 连接
java·mysql·adb
炸炸鱼.4 小时前
MySQL 故障排查与生产环境优化(精简实用版)
数据库·mysql·adb
_下雨天.4 小时前
MySQL 故障排查与生产环境优化
adb
刘晨鑫15 小时前
MySQL故障排查与生产环境优化
数据库·mysql·adb
PD我是你的真爱粉5 小时前
MySQL 锁机制:从理论分类到死锁实战
数据库·mysql·adb
翻斗包菜9 小时前
MySQL 生产环境故障排查与性能优化全攻略(8.0 版本实战)
adb
swIn KWAL18 小时前
【MySQL】环境变量配置
数据库·mysql·adb
翻斗包菜20 小时前
MySQL 主从复制 + MyCat2 读写分离 超详细实战教程(OpenEuler 环境)
adb
yy552720 小时前
Mysql 数据库与恢复
adb