MySQL如何备份非常大的数据库_mydumper多线程逻辑导出工具

mydumper 能显著加速大库导出,前提是表结构合理且 I/O 与网络不瓶颈;它通过多线程并发 dump 表(支持表内分块)远超 mysqldump 单线程性能,尤其适用于上百张表、超 100GB 场景。mydumper 能不能真正加速大库导出能,但前提是表结构合理、磁盘 I/O 和网络不成为瓶颈。它靠多线程并发 dump 表(甚至表内分块),比 mysqldump 单线程快数倍------尤其是有上百张表、总数据量超 100GB 的场景。常见错误现象:mydumper 启动后只跑一两个线程、CPU 利用率低、导出速度没提升。这往往不是工具问题,而是默认参数太保守或 MySQL 侧限制了并发。必须显式指定 -t(线程数),默认是 4,对大库通常不够;建议从 -t 8 或 -t 16 起调,观察 SHOW PROCESSLIST 中活跃连接数是否匹配MySQL 的 max_connections 得留足余量,mydumper 每个线程建一个连接,-t 16 就要至少 20+ 连接空闲如果表含大量 BLOB/TEXT 字段,开启 --skip-tz-utc 和 --compress 反而可能拖慢,因为压缩耗 CPU,而磁盘或网络未必是瓶颈导出时为什么某些表被跳过或报错 "Table doesn't exist"不是表真丢了,而是 mydumper 在初始扫描阶段读取 INFORMATION_SCHEMA.TABLES 后,后续 dump 时该表已被 DDL 修改(比如被 DROP 或 RENAME),导致一致性视图失效。使用场景:线上边导出边做表结构变更,或定时任务和运维操作未错开。加 --no-schemas 不能解决这个问题,它只跳过建表语句生成,不解决元数据快照问题真正有效的是 --snapshot-all(需 MySQL 5.6+ 且开启 binlog),它会先获取一个全局一致的 GTID 或 binlog position,再导出,确保所有线程看到同一时刻的表状态若 MySQL 版本旧或未开 binlog,只能靠业务低峰期操作 + --lock-all-tables(会加全局读锁,影响写入)mydumper 导出的文件怎么还原?不要想当然用 sourcemydumper 输出是多个 .sql(建表)和 .csv(数据)文件,混在一起用 source 会报错,因为 source 不认识 CSV 格式,也不处理文件依赖顺序。 通义听悟 阿里云通义听悟是聚焦音视频内容的工作学习AI助手,依托大模型,帮助用户记录、整理和分析音视频内容,体验用大模型做音视频笔记、整理会议记录。

相关推荐
花酒锄作田1 小时前
[python]argparse 包在聊天机器人中的应用
python
NiceCloud喜云3 小时前
Opus 4.8 的 Effort Control 怎么选:Low 到 Max 五档策略
android·java·大数据·前端·c++·python·spring
ccddsdsdfsdf3 小时前
DBeaver怎么链接mongoDB
数据库·mongodb
AI玫瑰助手3 小时前
Python函数:默认参数的定义与注意事项
开发语言·python·信息可视化
weixin_468466854 小时前
全局与局部注意力机制新手实战指南
人工智能·python·深度学习·算法·自然语言处理·transformer·注意力机制
小糖学代码4 小时前
LLM系列:环境搭建:5.Python-dotenv 环境变量管理
人工智能·python·深度学习·神经网络
丷丩4 小时前
Postgresql基础实践教程(十一)各种Join
数据库·postgresql·join
星夜夏空994 小时前
FreeRTOS学习(4)——内存映射
数据库·学习·mongodb
智慧物业老杨4 小时前
智慧物业合同周期管理系统:从风险预警到智能交接的全流程数智化落地方案
java·人工智能·python
橙橙笔记5 小时前
Python的学习第一部分
python·学习