redis数据丢失之脑裂

之前说的基本上都是老生常谈,下面呢咱们接着老生常谈

咱们知道redis集群本身需要主从复制,还是异步的,这就很容易出现问题,其中最严重的,最严重的问题也很多,比如数据丢失

脑裂

脑裂之前大家也听说过,这个词就很吓人,简单来说脑裂是网络分区导致的出现了多个脑子;比如网络突然就不正常,互相之间无法连通,slave无法正常通信,硬生生分成n个帮派,俗话说国不可一日无君,没有主心骨怎么行,各群内部分别选出新主,继续处理请求,最后导致数据的四分五裂,严重不一致这一严重后果

这时候咱们哨兵看不下去了,找不到master,那肯定是挂了呀

其实不一定,你像

1、网络分区延迟,超过了sentinel down-after-milliseconds < 网络隔离恢复时间,哨兵误判主节点下线

2、主节点资源不足:cpu过载、慢查询阻塞心跳检测

3、哨兵节点偶数了,无法多数据选举

怎么防止呢

哨兵模式

1、配置,不满足如下要求,主就不写了(老资不干了)对应的要做好监控,不能真不干活了,那后果可太严重了

复制代码
# 限制主节点最少从
min-slaves-to-write 2
# 主节点写入至少同步到N个从库
min-slaves-max-lag 10

2、哨兵一定一定要是奇数,超过三个;最好在不同的物理设备上,要不要下子全完了可太脆弱了

3、数据同步的时候对比节点差异,有一点风吹草动、马上解决

https://www.cnblogs.com/jimoliunian/p/18777685

cluster模式

1、节点间gossip通信,交换集群状态信息,主节点下线fail,得半数以上通过才行

2、节点负责的槽位都是唯一的,两节之间绝不会互相干涉(除非配置错或者有坑)

3、发生故障转移客户端收到moved重定向,到其他的节点,网络恢复旧的标记为从节点,从新的主同步数据,旧的之前的数据就被覆盖了,自动解决不一致问题

https://blog.csdn.net/2301_79814793/article/details/149415540

相关推荐
Database_Cool_38 分钟前
云原生多租户隔离 + 近实时分析怎么选型?阿里云 AnalyticDB MySQL 资源隔离方案
数据库·mysql·阿里云
小马爱打代码7 小时前
Redis 集群方案详解:主从复制、哨兵、脑裂、分片集群和哈希槽
数据库·redis·哈希算法
海南java第二人8 小时前
ClickHouse 稀疏索引深度解析:为什么 OLAP 数据库不用 B-Tree?
数据库·clickhouse
Litluecat8 小时前
信创迁移:Oracle切换海量数据库,慢sql扫描
数据库·sql·oracle·信创·海量
消失在人海中9 小时前
Oracle的CURRENT REDO丢失,数据丢失风险分析
数据库·oracle
喵了几个咪9 小时前
选择第三方IAM还是自建权限体系?中小型后台系统权限架构决策指南
数据库·oracle·架构
Elastic 中国社区官方博客10 小时前
Kibana:使用 AI Chat 及 MCP 轻松创建 AI 原生仪表板
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·信息可视化
杨云龙UP11 小时前
Oracle Health Check巡检脚本使用SOP V2.0:从HTML原始报告→生成Word专业巡检报告→交付客户_2026-06-03
linux·运维·数据库·sql·oracle·报告·巡检
Database_Cool_11 小时前
Hudi 湖仓一体架构:阿里云 AnalyticDB MySQL 原生集成最佳实践
数据库·mysql·阿里云