深入分析ZooKeeper的选举机制

ZooKeeper选举通常在以下两种情况下被触发：

ZooKeeper默认使用**FastLeaderElection（快速选举）**算法，核心步骤如下：

节点状态 ：
- LOOKING：正在寻找Leader。
- FOLLOWING：已确认Leader并作为Follower工作。
- LEADING：自身成为Leader。
投票内容 ：每个节点投票包含以下关键信息：
- myid：服务器唯一ID（配置文件中定义）。
- ZXID：最新事务ID（高32位为epoch，低32位为计数器）。
- 逻辑时钟（epoch）：标识选举轮次，防止旧投票干扰新选举。

初始化阶段：
- 所有节点启动时处于LOOKING状态，首先投票给自己（投(myid, ZXID)）。
广播投票：
- 节点将自身投票信息广播给集群中其他所有节点（通过TCP连接）。
接收投票与更新逻辑：
- 每个节点接收其他节点的投票，并根据规则更新自己的投票 ：
  - 优先比较ZXID：选择ZXID最大的节点（ZXID大代表数据更新）。
  - ZXID相同则比较myid：选择myid更大的节点（确保唯一性）。
统计投票与确认Leader：
- 节点持续收集投票，若发现某个节点的投票得到**超过半数（Quorum）**支持，则确认该节点为Leader。
- 确认后，节点状态转为FOLLOWING或LEADING，并结束选举。

假设集群有3个节点（myid=1、2、3），ZXID分别为0x100000001、0x100000002、0x100000001：

ZXID结构 ：epoch (高32位) + 计数器 (低32位)。
- epoch：每次选举后递增，标识Leader周期。旧Leader恢复后因epoch较小无法干扰新Leader。
- 计数器：事务操作的单调递增序列，保证操作顺序性。

Quorum（多数派）原则 ：只有获得超过半数节点支持的候选者才能成为Leader。
- 集群节点数为N时，Quorum数量为N//2 + 1（如3节点需2票）。
- 防止脑裂：网络分区时，仅多数派所在分区能选出Leader，避免双主问题。

选举完成后，Leader进入数据同步阶段：

ZooKeeper的选举机制通过FastLeaderElection算法 实现高效、可靠的Leader选举，依赖ZXID优先级 和Quorum机制确保数据一致性与集群高可用。理解其核心流程与关键设计（如epoch防脑裂、差异化同步）是优化分布式系统稳定性的基础。