在 MySQL 主从架构中,数据一致性是运维的核心诉求 ------ 网络波动、大事务中断、误操作等都可能导致主从数据偏差,进而引发业务异常。今天分享一款 Percona Toolkit 旗下的神器pt-table-sync,通过实战案例教大家高效修复主从数据不一致问题。
一、工具前置准备
1. 安装 Percona Toolkit
pt-table-sync是 Percona Toolkit 的核心工具之一,需先完成安装:
bash
# Ubuntu/Debian系统
sudo apt-get update && sudo apt-get install percona-toolkit -y
# CentOS/RHEL系统
sudo yum install percona-toolkit -y
验证安装:pt-table-sync --version 显示版本号即成功。

2. 前置校验条件
修复前需确保:
-
主从复制正常运行(
show slave status中 Slave_IO_Running 和 Slave_SQL_Running 均为 Yes) -
已通过
pt-table-checksum生成校验信息(存储在percona.checksums表)
bash
# 主库执行校验(需提前创建percona库)
pt-table-checksum --replicate=percona.checksums h=192.168.184.151,u=dba,p=Id81Gdac_a
- 从库可通过主库授权账号(如 dba)正常访问
sql
CREATE USER 'dba'@'192.168.%' IDENTIFIED WITH MYSQL_NATIVE_PASSWORD BY 'Id81Gdac_a';
GRANT SELECT, INSERT, UPDATE, DELETE, REPLICATION CLIENT ON *.* TO 'dba'@'192.168.%';
二、核心操作实战
假设主库 IP 为 192.168.184.150,从库 IP 为 192.168.184.152,授权账号 u=dba,密码 Id81Gdac_a。
1. 预览修复语句(安全第一)
先通过--print参数输出修复 SQL,不实际执行,避免误操作:
bash
# 全库一致性修复预览
pt-table-sync --print \
--replicate=percona.checksums \
--sync-to-master h=192.168.184.152,u=dba,p=Id81Gdac_a

关键说明:
--sync-to-master表示以主库为数据源同步从库,所有修改都会先在主库执行,再通过复制同步到从库,避免直接修改从库引发的复制异常。
2. 指定数据库修复预览
若仅需同步maria库的数据:
bash
pt-table-sync --print \
--replicate=percona.checksums \
--sync-to-master h=192.168.184.152,u=dba,p=Id81Gdac_a \
--databases=maria

3. 执行实际修复操作
确认预览的 SQL 语句无误后,用--execute参数执行修复:
bash
pt-table-sync --execute \
--replicate=percona.checksums \
--sync-to-master h=192.168.184.152,u=dba,p=Id81Gdac_a \
--databases=maria
执行耗时:根据数据量而定,建议在业务低峰期操作,大表可通过
--chunk-size拆分数据块减少锁影响。
三、关键参数详解
| 参数 | 作用 |
|---|---|
--replicate=percona.checksums |
指定校验信息存储表,需与pt-table-checksum的输出表一致 |
--sync-to-master |
自动识别从库对应的主库,以主库为数据基准 |
--print |
仅输出修复 SQL,不执行(推荐先执行此步骤) |
--execute |
执行修复操作(谨慎使用) |
--databases |
指定需同步的数据库(多库用逗号分隔) |
--tables |
指定需同步的表(格式:db.tbl,多表用逗号分隔) |
四、避坑注意事项
-
数据备份:修复前务必对从库数据备份,避免工具异常导致数据丢失
-
权限要求 :执行账号需具备主库的
UPDATE、DELETE权限,从库的SELECT权限 -
禁止直接修改从库 :
pt-table-sync默认通过主库执行修改,禁止使用--direct参数直接操作从库(可能破坏复制链路) -
主从延迟处理:修复前需确保主从延迟在可接受范围(`Seconds_Behind_Master ),避免同步期间产生新的不一致
-
测试环境验证:新环境首次使用时,建议先在测试集群验证,再应用到生产环境
五、修复后验证
bash
# 重新执行校验,确认无差异
pt-table-checksum --replicate=percona.checksums h=192.168.184.151,u=dba,p=Id81Gdac_a
# 从库查看同步状态
show slave status\G
# 关键指标:Seconds_Behind_Master=0,无复制错误

总结
pt-table-sync的核心优势在于安全高效 ------ 通过主库间接同步从库,避免直接操作从库的风险,同时支持细粒度的库表筛选。日常运维中,建议将pt-table-checksum(定期校验)与pt-table-sync(异常修复)配合使用,形成主从一致性保障体系。
如果遇到复杂场景(如无主键表、大事务表同步),欢迎在评论区交流探讨!