详解redis(5):Gossiping 协议

Gossip 协议 = 节点之间"不断八卦彼此状态"的去中心化健康检测机制

**一、**Redis Cluster 中 Gossip 在干什么?

Gossip 主要负责 4 件事:

  1. 节点发现

  2. 节点健康检测

  3. 主从状态传播

  4. 故障信息达成一致

二、Gossip 是怎么通信的

Redis Cluster 使用两种端口:

端口 用途
普通端口(6379) 客户端请求
Cluster Bus(16379) 节点间 Gossip

Gossip 的基本通信模型

每个节点:

周期性随机选几个节点

发送 PING

对方返回 PONG

消息里不仅包含"我还活着",还包含:

我知道的其他节点状态

消息里都带了什么?

一次 Gossip 消息里可能包含:

节点 ID

节点角色(主 / 从)

是否主观下线是否客观下线

slot 分配信息

复制关系

三、Redis Cluster 如何判断节点挂了?

第一步:主观下线(PFAIL)

某一个节点自己觉得:某节点可能挂了

条件:

连续一段时间 PING 不通

超过 cluster-node-timeout

结果:

给该节点打上 PFAIL

通过 Gossip 告诉其他节点

这一步不做任何故障转移

第二步:客观下线(FAIL)

足够多的主节点一致认为:它真的挂了

条件:

多个 主节点

都对同一节点标记 PFAIL

数量 ≥ quorum(法定人数)

结果:

升级为 FAIL

触发故障转移流程

四、故障转移是如何触发的?

M1(主) ─ S1(从)

故障流程:

  1. 多个主节点通过 Gossip 发现 M1 = FAIL

  2. M1 的从节点(S1)开始竞选

  3. 每个主节点只能投 1 票

  4. 得票 ≥ 半数主节点

  5. S1 升级为新主

  6. 重新分配 hash slot

五、为什么要奇数个主节点?

这是分布式系统的经典问题:多数派原则

假设你只有 2 个主节点

网络分区:

分区 A:M1

分区 B:M2

两边都只有 1 票

无法达到多数

整个集群不可写

假设你有 3 个主节点

分区 A:M1 + M2
分区 B:M3

A:2 票 → 多数

B:1 票 → 少数

只有一边能继续对外服务

六、为什么 Redis 选择 Gossip?

优点

无中心节点

可扩展

节点数大也能跑

容错强

缺点

状态收敛是"最终一致"

有传播延迟

短时间内可能认知不一致

相关推荐
霖霖总总2 小时前
[小技巧40]MySQL中的MVCC:多版本并发控制的深度解析
数据库·mysql
德彪稳坐倒骑驴2 小时前
DataX将数据在MySQL和HDFS之间互相迁移
数据库·mysql·hdfs
结衣结衣.2 小时前
Redis中的Hash哈希
数据库·redis·哈希算法
Coder_Boy_2 小时前
基于SpringAI的在线考试系统-考试管理功能布局+交互优化方案
java·数据库·人工智能·spring boot·交互·ddd·tdd
IT大白2 小时前
4、数据库的事务
数据库
扑火的小飞蛾2 小时前
【Oracle Database 分区表】之间隔分区_11g(一)
数据库·oracle
Frank_refuel2 小时前
C++STL之set和map的接口使用介绍
数据库·c++·算法
l1t2 小时前
利用DeepSeek辅助翻译clickhouse SQL为DuckDB 格式求解Advent of Code 2025第10题 电子工厂 第二部分
数据库·人工智能·sql·clickhouse·duckdb
DarkAthena2 小时前
【GaussDB】分析函数性能优化案例-row_number改写
数据库·sql·oracle·性能优化·gaussdb