gt-checksum v4.0.0 发布|续跑回滚双加持,异构迁移与安全能力跃升

GreatSQL 社区开源的数据库校验及修复工具 gt-checksum 迎来 v4.0.0 大版本重磅更新!本次升级直击生产环境数据校验的核心痛点,新增断点续传、反向回滚 SQL、自定义数据类型映射等关键能力,同时在权限预检、安全策略、性能优化等维度全面增强,让数据校验与修复真正适配生产级场景。

一、为什么升级?生产环境的「校验痛点」

在数据库迁移验收、跨版本升级、主从一致性检查、Oracle → MySQL 异构迁移等场景中,我们总能遇到这些棘手问题:

  • 校验任务跑了几小时突然中断,只能从头再来,耗时又耗资源;
  • 在线修复数据后发现不符合预期,却没有现成的回滚手段;
  • 异构迁移时数据类型不匹配,需要手动逐列对齐映射规则;
  • 工具误将「无权限访问的表」判为「表不存在」,生成错误修复 SQL;
  • DSN 连接串明文存储密码,日志 / 配置文件存在泄露风险。

gt-checksum v4.0.0 正是围绕这些真实痛点,完成了一次「从工具级到生产级」的系统性升级 ------ 核心就是让数据校验与修复流程:可续跑、可回滚、可诊断、可审计。

二、核心新能力:直击痛点,全面升级

🌀 断点续传:大任务中断不再「从头再来」

大规模校验任务中断后,无需重复扫描全表、重复执行修复 SQL,新增 resume 参数(支持 OFF/ON/ASK 三种模式),让续跑更安全、更高效:

  • gt-checksum:进度文件记录已完成的 chunk 和行数统计结果,续传时仅跳过已安全生成修复 SQL 的数据块,断点超 1 小时会提示用户确认;
  • repairDB:中断时停止调度新文件,等待已执行的 SQL 文件完成,避免续传时重放「半执行文件」;
  • 核心价值:行数统计结果缓存复用,显著降低续传启动开销,大表校验效率提升显著。

🔙 反向回滚 SQL:修复可审计、可回退

告别「修复后无法回滚」的风险,新增完整的回滚 SQL 生成能力,让修复操作有「后悔药」:

  • 核心参数:genRollSQL(控制是否生成回滚语句)、maxRollRowNum(避免大表回滚文件过大)、rollFileDir(回滚文件存储目录);
  • 回滚逻辑:INSERT 对应 DELETE、DELETE 对应 INSERT,支持有 / 无主键表;
  • 安全边界:目标端整表为空时,强制生成 TRUNCATE TABLE 回滚 SQL,兜底数据安全;
  • 便捷回退:修复时同步生成回滚文件,后续可通过 repairDB ./rollsql 一键回退。

🗺️ 自定义数据类型映射:适配复杂迁移场景

针对 Oracle → MySQL、MySQL 跨版本升级、MariaDB → MySQL 等异构 / 跨版本迁移场景,新增 dTypeMappingFile 参数,支持自定义 YAML/JSON 格式的类型映射规则:

  • 支持 schema/table/column 三级精细化控制,覆盖 nullable、unsigned、autoinc 等属性;
  • 新增 --preview-dtype-mapping 参数,可预览最终映射规则,便于调试配置;
  • 核心价值:告别手动对齐数据类型,适配各类复杂迁移场景。

🔒 DSN 密文 + SSL 加密:筑牢安全防线

安全能力双升级,从连接到存储全面防护:

  • DSN 密文保护:srcDSN/dstDSN 密码必须用 ENC... 密文,新增 gt-dsn-crypt 工具(支持生成密钥、加密 / 解密),日志自动脱敏密码;
  • SSL 加密连接:源端 / 目标端可独立配置 SSL 参数(支持 DISABLED/PREFERRED/REQUIRED 等 5 种模式),repairDB 同步支持目标端 SSL 配置。

✂️ truncateBeforeAlter:大表结构修复加速

针对大表结构修复时 ALTER 操作耗时的问题,新增 truncateBeforeAlter 参数(默认关闭):

  • 功能:在 checkObject=struct 模式下,ALTER 前自动生成 TRUNCATE TABLE,并恢复源端 AUTO_INCREMENT 序列;
  • 注意:仅适合「目标端数据可丢弃」的场景,生产环境需谨慎开启。

📊 在线修复状态列:结果一目了然

checkObject=datadatafix=table 模式下,终端和 CSV 结果新增 Fixed 列,清晰展示修复 SQL 的执行状态(执行 / 跳过 / 报错),修复结果可追溯。

三、功能优化 & 安全增强:细节处见实力

权限预检全面升级

  • 区分源端(只读)/ 目标端(写权限)角色,按 checkObject 精确匹配所需权限;
  • 缺失权限时输出清晰的授权建议(含 GRANT 语句),适配不同 MySQL/MariaDB 版本;
  • 优化「目标表不可见」处理,避免误判为表不存在并生成错误修复 SQL。

COLLATE 修复逻辑优化

  • 类型映射覆盖时,生成列级 MODIFY COLUMN SQL(含 collation + 类型映射);
  • utf8mb4 默认 collation 漂移仅返回警告,减少无意义的修复 SQL;
  • 修复列顺序调整被误判为属性变更的问题。

在线修复安全策略优化

  • 执行顺序:先 DELETE 后 INSERT/UPDATE,降低主键 / 唯一键冲突风险;
  • 非数据对象:struct/trigger/routine 模式下强制导出修复 SQL,需人工审核后执行;
  • 无主键表:简化 DELETE 逻辑,避免 NULL 值导致的语句错误;
  • 合并重复 DELETE 语句,减少回滚文件体积。

性能 & 代码重构

  • 源 / 目标端行数并行查询,减少等待时间;
  • repairDB、oracle_random_data_load 模块化重构,代码可维护性提升。

四、典型问题修复:踩过的坑都填上了

  • Duplicate Key 处理:multi-values INSERT 遇主键冲突时,自动拆分为单行重试,避免整批失败;
  • 回滚 SQL 修复:解决启动时序竞态、无索引表 TRUNCATE 回滚条件误判、断点续传回滚范围过大等问题;
  • 无索引表修复:修复 datafix=table 场景下仅生成语句但未执行的问题;
  • 类型映射 & SQL 输出:调整 Oracle NUMBER (19,0) 映射阈值,修复数值列 SQL 字面量输出错误;
  • 断点续传:修复 datafix=file 场景下 chunk 状态误判、不完整事务截断等问题;
  • repairDB 中断:收到中断信号时等待已执行文件完成,避免半执行文件重放。

五、测试全覆盖:稳定才是硬道理

v4.0.0 新增大量回归测试,覆盖核心场景:

  • truncateBeforeAlter、在线修复主键冲突、回滚 SQL 生成;
  • 权限预检、断点续传、数据类型映射;
  • struct 校验修复、MySQL/Oracle 权限适配等。

六、生产落地建议

  1. 迁移验收:启用 resume=ON + genRollSQL=ON,确保中断可续、修复可回滚;
  2. Oracle → MySQL 迁移:用 dTypeMappingFile 自定义类型映射,提前预览验证;
  3. 安全敏感环境:使用 gt-dsn-crypt 加密密码,配置 SSL 连接,开启日志脱敏;
  4. 大表结构修复:目标端数据可丢弃时,可开启 truncateBeforeAlter=ON 加速;
  5. 在线修复:关注 Fixed 列状态,结合回滚文件做修复后验证。

七、未来规划:不止于此

v4.0.0 已完成 Roadmap 中「修复回滚、自定义类型映射、断点续传、SSL 连接、truncateBeforeAlter」等核心规划项,后续将聚焦:

  • 守护进程模式运行;
  • 实时监控数据变化;
  • 全量 + 增量校验能力。

八、立即体验

总结

gt-checksum v4.0.0 不是简单的「参数新增」,而是一次面向生产环境的「系统性升级」------ 断点续传让大任务不再脆弱,回滚 SQL 让修复可审计,自定义类型映射适配复杂迁移,DSN 密文 + SSL 筑牢安全防线。无论你是做数据库迁移、主从一致性校验,还是跨版本升级,都推荐升级体验这款「更懂生产环境」的校验修复工具!