详解redis(5):Gossiping 协议

Gossip 协议 = 节点之间"不断八卦彼此状态"的去中心化健康检测机制

**一、**Redis Cluster 中 Gossip 在干什么?

Gossip 主要负责 4 件事:

  1. 节点发现

  2. 节点健康检测

  3. 主从状态传播

  4. 故障信息达成一致

二、Gossip 是怎么通信的

Redis Cluster 使用两种端口:

端口 用途
普通端口(6379) 客户端请求
Cluster Bus(16379) 节点间 Gossip

Gossip 的基本通信模型

每个节点:

周期性随机选几个节点

发送 PING

对方返回 PONG

消息里不仅包含"我还活着",还包含:

我知道的其他节点状态

消息里都带了什么?

一次 Gossip 消息里可能包含:

节点 ID

节点角色(主 / 从)

是否主观下线是否客观下线

slot 分配信息

复制关系

三、Redis Cluster 如何判断节点挂了?

第一步:主观下线(PFAIL)

某一个节点自己觉得:某节点可能挂了

条件:

连续一段时间 PING 不通

超过 cluster-node-timeout

结果:

给该节点打上 PFAIL

通过 Gossip 告诉其他节点

这一步不做任何故障转移

第二步:客观下线(FAIL)

足够多的主节点一致认为:它真的挂了

条件:

多个 主节点

都对同一节点标记 PFAIL

数量 ≥ quorum(法定人数)

结果:

升级为 FAIL

触发故障转移流程

四、故障转移是如何触发的?

M1(主) ─ S1(从)

故障流程:

  1. 多个主节点通过 Gossip 发现 M1 = FAIL

  2. M1 的从节点(S1)开始竞选

  3. 每个主节点只能投 1 票

  4. 得票 ≥ 半数主节点

  5. S1 升级为新主

  6. 重新分配 hash slot

五、为什么要奇数个主节点?

这是分布式系统的经典问题:多数派原则

假设你只有 2 个主节点

网络分区:

分区 A:M1

分区 B:M2

两边都只有 1 票

无法达到多数

整个集群不可写

假设你有 3 个主节点

分区 A:M1 + M2
分区 B:M3

A:2 票 → 多数

B:1 票 → 少数

只有一边能继续对外服务

六、为什么 Redis 选择 Gossip?

优点

无中心节点

可扩展

节点数大也能跑

容错强

缺点

状态收敛是"最终一致"

有传播延迟

短时间内可能认知不一致

相关推荐
zxrhhm1 分钟前
SQLServer限制特定数据库的CPU使用率,确保关键业务系统有足够的资源
数据库·sqlserver
刘~浪地球24 分钟前
Redis 从入门到精通(十三):哨兵与集群
数据库·redis·缓存
dyyshb1 小时前
PostgreSQL 终极兜底方案
数据库·postgresql
他们叫我技术总监1 小时前
零依赖!FineReport11 快速对接 TDengine 数据库:从驱动部署到报表实现
大数据·数据库·ai·tdengine
TDengine (老段)1 小时前
TDengine IDMP 可视化 —— 定时报告
大数据·数据库·人工智能·物联网·时序数据库·tdengine·涛思数据
曹牧1 小时前
Oracle:
数据库·oracle
kobel281 小时前
Linux x86快速部署openGauss3.1.1指南
数据库
一个有温度的技术博主1 小时前
Lua语法详解:从变量声明到循环遍历的避坑指南
redis·缓存·lua
草莓熊Lotso2 小时前
【Linux 线程进阶】进程 vs 线程资源划分 + 线程控制全详解
java·linux·运维·服务器·数据库·c++·mysql
supericeice2 小时前
创邻科技 Galaxybase Graph Intelligence 图智能平台:一站式可视化图数据存储、图计算与图挖掘平台
数据库·科技