[Redis小技巧21]从 Binlog 到缓存：Canal + Redis 同步架构全解

一、背景与动机：为什么需要通过 Binlog 同步缓存？

在现代分布式系统中，缓存一致性 是绕不开的核心问题。传统方案如 Cache-Aside（缓存分离） 虽然简单，但在高并发场景下存在明显缺陷：

而基于 MySQL binlog 的异步同步方案（如 Canal + Redis）则能实现：

Canal 是阿里巴巴开源的 MySQL binlog 增量订阅 & 消费组件，其核心思想是 伪装成 MySQL Slave，通过标准 binlog 协议拉取数据。

组件	功能
Canal Server	模拟 MySQL Slave，连接主库拉取 binlog
EventParser	解析原始 binlog 为结构化事件（INSERT/UPDATE/DELETE）
EventSink	将解析后的事件按事务聚合
EventStore	存储事件队列，支持内存或 Kafka/RocketMQ
Canal Client	消费端，订阅事件并执行业务逻辑（如更新 Redis）

注意：MySQL 必须设置 binlog_format=ROW，否则无法获取完整行变更。

策略	说明	适用场景
延迟双删	先删缓存 → 更新 DB → 延迟 N 秒再删缓存	强一致性要求不高
版本号/时间戳	在 DB 中增加 `version` 字段，缓存携带版本，写入时校验	高并发写冲突多
Binlog 顺序消费	确保同一 Key 的变更按序处理（如 Kafka 分区按主键哈希）	严格最终一致

推荐：结合 版本号 + 顺序消费，可应对 99% 的生产场景。

场景	Redis 命令	示例
更新对象	`HSET key field value [field value ...]`	`HSET user:1001 name Alice age 30`
删除缓存	`DEL key`	`DEL user:1001`
设置过期	`EXPIRE key seconds`	`EXPIRE user:1001 3600`
发布通知	`PUBLISH channel message`	`PUBLISH cache-invalidate user:1001`
批量操作	`PIPELINE` 或 `MULTI/EXEC`	减少网络往返

提示：对于嵌套对象，建议使用 Hash 而非 JSON 字符串，便于部分更新。

答：Canal Client 消费成功后，会向 Server ACK 当前位点。Server 持久化该位点（默认内存，可配 ZooKeeper）。若 Client 重启，从最后 ACK 位置继续拉取。

答：1）业务层读取时加版本号校验；2）对强一致场景，读 DB 后强制刷新缓存；3）监控延迟指标，超阈值告警。

答：UDF/Trigger 会阻塞 DB 主流程，影响写性能，且难以维护。Binlog 方案完全异步，对 DB 无侵入。

答：可以。Canal 支持配置多个 instance，每个 instance 监听一个 DB。也可通过正则匹配多表（如 .*\.order_.*）。

答：Client 应具备重试机制（指数退避），并将失败事件暂存（如本地文件或 Kafka）。待 Redis 恢复后重放。