Redis Cluster 集群选举机制

上篇文章提到了Redis Cluster，本篇文章介绍一下Redis Cluster的选举机制。主要包括选举时机，选举过程，选举策略等。

Redis Cluster 作为 Redis 官方分布式集群方案，内置了完整的故障检测与自动选举故障转移机制 。集群不需要额外部署哨兵，依靠节点间通信与自研的改良多数派共识算法 ，实现主节点故障后，从节点自动竞选晋升为新主节点，保障集群高可用。

本次选举仅针对故障主节点的从节点晋升，并非全局领导者选举，全程围绕故障转移、票数规则、纪元版本、防脑裂设计展开。

在选举体系中，集群节点权限严格区分：

选举并不会在节点网络断开瞬间触发，Redis 设置了严谨的故障确认流程，避免网络抖动造成误切换：

Redis Cluster 严格遵循分布式多数派原则 ，当选票数公式固定：
需要票数=⌈集群总主节点数2⌉+1 \boldsymbol{需要票数 = \left\lceil\frac{集群总主节点数}{2}\right\rceil + 1} 需要票数=⌈2集群总主节点数⌉+1

举例说明：

该过半机制来源于分布式共识理论，唯一目的是防止脑裂 ：

在网络分区、集群割裂的场景下，无论网络如何断开，整个集群最多只会存在一个能够集齐过半票数的分区，其余小分区票数不足，无法选举出新主，不会出现双主节点、数据分裂的问题。

同一个故障主节点下存在多个从节点时，Redis 会按照固定优先级排序，决定哪个从节点优先发起选举，优先级由高到低：

这是 Redis Cluster 解决旧主复活冲突、重复选举、双主并存的底层版本算法，也是绝大多数讲解忽略的核心设计。

Epoch 定义
集群全局单调递增的版本号，代表集群状态纪元，每完成一次故障转移选举，纪元号自动 +1。
权限规则
- 节点纪元号越大，集群权限越高。
- 新选举出的主节点，拥有全网最大的纪元号。
防脑裂作用
若原本故障的旧主节点网络恢复，由于其纪元号小于新主节点，集群不承认其主节点身份，强制降级为从节点 ，禁止对外写入，只能被动同步新主数据。
从根源杜绝旧主复活抢占槽位、集群双主、数据不一致的脑裂问题。

结合过半选举规则，可以直接推导出集群存活底线：

集群中存活的主节点数量，必须超过总主节点数量的一半，集群才能完成选举、正常对外服务。

实例分析：

因此生产环境 Redis Cluster 均采用奇数主节点部署（3主、5主、7主），偶数节点会造成集群容错率浪费，无额外收益。

Redis Cluster 并未使用标准 Raft 算法，而是借鉴 Raft 多数派思想自研简化版故障选举算法 ：

以Quorum 过半机制 作为投票核心依据，严格限制主节点投票权，结合数据偏移量判定从节点竞选优先级，搭配全局单调递增 Epoch 纪元版本号 彻底解决脑裂问题。

在主节点故障时快速完成从节点晋升、槽位接管，实现业务无感知的自动故障转移，是 Redis 分布式集群高可用的底层基石。