MySQL8主从数据库复制故障

MySQL8主从数据库复制故障

检查从库的状态,发现 Slave_IO_Running :Yes ,Slave_SQL_Running :No

报错信息如下:

Coordinator stopped because there were error(s) in the worker(s). ... Worker 1 failed executing transaction ...

SQL 线程在回放事务时遇到异常,复制被自动挂起。 MySQL 8 并行复制(slave_parallel_workers > 0)最常见的报错样式。

一、定位分析错误
  1. 登录从库
sql 复制代码
mysql> SELECT * FROM performance_schema.replication_applier_status_by_worker;

最后一行会出现类似:

1146 Worker 1 failed executing transaction 'd841e3f6-8e07-11f0-aad4-00d861733003:15155609' at master log mybinlog.000334, end_log_pos 11343248; Error executing row event: 'Table 'db.ts_list' doesn't exist'

  1. 可以直接看错误日志
bash 复制代码
grep -A5 "d841e3f6-8e07-11f0-aad4-00d861733003:15155609" mysqld.err

日志里会打印 具体 SQL / 事件类型errno

3.处理方式:

在主库上找到 表 ts_list 的创建表语句,在从库上执行创建表;

bash 复制代码
mysql> stop slave ;
mysql> start slave;
mysql> show slave status;
mysql> show processlist;

停止同步,启动同步,检查状态,看是否

Slave_IO_Running :Yes

Slave_SQL_Running :Yes

检查同步进程是否运行。

二、另外常见错误
场景 日志典型片段 出现原因 处理方案
1. 主键/唯一键冲突 Duplicate entry 'xxx' for key 'PRIMARY' 主从数据已不一致:主库 insert 时从库已有该行 pt-table-checksum / table-sync 确认是否只有这一行差异; 仅差异一行:SET GLOBAL sql_slave_skip_counter=1; START SLAVE;SKIP_TRANSACTION; 差异很多:重建从库或在线修复。
2. 行找不到(1032) Could not execute Delete_rows / Update_rows ... Can't find record 主库 delete/update 时从库已无该行 同上,用 pt-table-sync 修复后再次启动 SQL 线程; 临时应急可 sql_slave_skip_counter=1
3. 外键约束失败(1452) Cannot add or update a child row: a foreign key constraint fails 从库外键检查严格(slave_skip_errors 未忽略 1452)且数据缺失父行 ① 确认 foreign_key_checks=1 导致; ② 先修复父表数据; ③ 或临时 SET GLOBAL foreign_key_checks=OFF; START SLAVE; 再补齐数据。
4. 列不存在或类型不符 Unknown column 'col_new' ... / Incorrect integer value 主库已 DDL(加列/改列),从库未执行或执行失败 ① 手动在从库补跑缺失 DDL; ② 确保 log_slave_updates=ON 且 DDL 在 binlog 里; ③ 若 GTID 连续可 STOP/START SLAVE 重新拉取。

三、MySQL 8 推荐修复步骤(GTID 环境)
  1. 找到错误号
sql 复制代码
mysql> SELECT LAST_ERROR_NUMBER, LAST_ERROR_MESSAGE
FROM performance_schema.replication_applier_status_by_worker
WHERE WORKER_ID=1;
  1. 若确定只有 单事务 有问题,可 注入空事务跳过(无需重启):
sql 复制代码
-- 在主库执行
SET GTID_NEXT='d841e3f6-8e07-11f0-aad4-00d861733003:15155609';
BEGIN; COMMIT;
SET GTID_NEXT='AUTOMATIC';

然后从库自动继续。

四、预防配置建议
ini 复制代码
[mysqld]
slave_parallel_workers=4              # 并行复制
slave_parallel_type=LOGICAL_CLOCK
slave_preserve_commit_order=ON
binlog_transaction_dependency_tracking=WRITESET
slave_skip_errors=0                   # 除非确定要忽略指定错误码
log_slave_updates=ON                  # 级联/故障切换必备
gtid_mode=ON                          # 方便跳过事务
五、总结

报错是复制挂起,真正原因要去 replication_applier_status_by_worker 或错误日志里看 errno/消息

大部分的错误可能是 **数据不一致 → 主键冲突/1032/1452 ,按错误号,对于处理方法解决。

相关推荐
墨黎芜17 分钟前
SQL Server从入门到精通——C#与数据库
数据库·学习·信息可视化
爱学习的阿磊17 分钟前
持续集成/持续部署(CI/CD) for Python
jvm·数据库·python
一个响当当的名号17 分钟前
lectrue10 排序和聚合算法
数据库
hamawari23 分钟前
SQL语法
数据库·sql·oracle
陌上丨28 分钟前
Redis内存使用率在95%以上,请问是什么原因?如何解决?
数据库·redis·缓存
m0_5613596740 分钟前
使用PyQt5创建现代化的桌面应用程序
jvm·数据库·python
2301_7903009641 分钟前
用Python实现自动化的Web测试(Selenium)
jvm·数据库·python
xiaoye37081 小时前
redis和mysql数据库如何保证数据一致性
redis·mysql
m0_561359671 小时前
使用Docker容器化你的Python应用
jvm·数据库·python