之前说的基本上都是老生常谈,下面呢咱们接着老生常谈
咱们知道redis集群本身需要主从复制,还是异步的,这就很容易出现问题,其中最严重的,最严重的问题也很多,比如数据丢失
脑裂
脑裂之前大家也听说过,这个词就很吓人,简单来说脑裂是网络分区导致的出现了多个脑子;比如网络突然就不正常,互相之间无法连通,slave无法正常通信,硬生生分成n个帮派,俗话说国不可一日无君,没有主心骨怎么行,各群内部分别选出新主,继续处理请求,最后导致数据的四分五裂,严重不一致这一严重后果
这时候咱们哨兵看不下去了,找不到master,那肯定是挂了呀
其实不一定,你像
1、网络分区延迟,超过了sentinel down-after-milliseconds < 网络隔离恢复时间,哨兵误判主节点下线
2、主节点资源不足:cpu过载、慢查询阻塞心跳检测
3、哨兵节点偶数了,无法多数据选举
怎么防止呢
哨兵模式
1、配置,不满足如下要求,主就不写了(老资不干了)对应的要做好监控,不能真不干活了,那后果可太严重了
# 限制主节点最少从
min-slaves-to-write 2
# 主节点写入至少同步到N个从库
min-slaves-max-lag 10
2、哨兵一定一定要是奇数,超过三个;最好在不同的物理设备上,要不要下子全完了可太脆弱了
3、数据同步的时候对比节点差异,有一点风吹草动、马上解决
https://www.cnblogs.com/jimoliunian/p/18777685
cluster模式
1、节点间gossip通信,交换集群状态信息,主节点下线fail,得半数以上通过才行
2、节点负责的槽位都是唯一的,两节之间绝不会互相干涉(除非配置错或者有坑)
3、发生故障转移客户端收到moved重定向,到其他的节点,网络恢复旧的标记为从节点,从新的主同步数据,旧的之前的数据就被覆盖了,自动解决不一致问题
https://blog.csdn.net/2301_79814793/article/details/149415540