redis数据丢失之脑裂

星辰_mya2025-12-29 8:07

之前说的基本上都是老生常谈，下面呢咱们接着老生常谈

咱们知道redis集群本身需要主从复制，还是异步的，这就很容易出现问题，其中最严重的，最严重的问题也很多，比如数据丢失

脑裂之前大家也听说过，这个词就很吓人，简单来说脑裂是网络分区导致的出现了多个脑子；比如网络突然就不正常，互相之间无法连通，slave无法正常通信，硬生生分成n个帮派，俗话说国不可一日无君，没有主心骨怎么行，各群内部分别选出新主，继续处理请求，最后导致数据的四分五裂，严重不一致这一严重后果

这时候咱们哨兵看不下去了，找不到master，那肯定是挂了呀

其实不一定，你像

1、网络分区延迟，超过了sentinel down-after-milliseconds < 网络隔离恢复时间，哨兵误判主节点下线

2、主节点资源不足：cpu过载、慢查询阻塞心跳检测

3、哨兵节点偶数了，无法多数据选举

怎么防止呢

1、配置，不满足如下要求，主就不写了（老资不干了）对应的要做好监控，不能真不干活了，那后果可太严重了

复制代码

# 限制主节点最少从
min-slaves-to-write 2
# 主节点写入至少同步到N个从库
min-slaves-max-lag 10

2、哨兵一定一定要是奇数，超过三个；最好在不同的物理设备上，要不要下子全完了可太脆弱了

3、数据同步的时候对比节点差异，有一点风吹草动、马上解决

1、节点间gossip通信，交换集群状态信息，主节点下线fail，得半数以上通过才行

2、节点负责的槽位都是唯一的，两节之间绝不会互相干涉(除非配置错或者有坑)

3、发生故障转移客户端收到moved重定向，到其他的节点，网络恢复旧的标记为从节点，从新的主同步数据，旧的之前的数据就被覆盖了，自动解决不一致问题