Zookeeper底层原理

ZooKeeper 是一个高可用的分布式协调服务,广泛应用于分布式系统中,用于解决分布式系统的一致性问题。下面将详细介绍 ZooKeeper 的底层原理,包括其架构、数据模型、核心机制和一致性协议等方面。

1. 架构

ZooKeeper 采用主从架构(Master-Slave),通常由一个 Leader 和若干个 Follower 组成,还有 Observer 节点作为非投票节点,用于分担读请求的压力。

  • Leader:负责处理所有写请求(事务请求)和协调一致性协议。
  • Follower:参与投票选举和同步 Leader 的状态,处理读请求。
  • Observer:不参与投票选举,仅处理客户端的读请求和转发写请求。

2. 数据模型

ZooKeeper 以类似文件系统的树形结构存储数据,每个节点称为 znode。

  • znode:数据节点,具有路径、数据和状态信息。
  • 持久节点(Persistent znode):节点在客户端断开后依然存在,除非被显式删除。
  • 临时节点(Ephemeral znode):节点在客户端断开连接时自动删除。
  • 顺序节点(Sequential znode):节点在创建时自动附加一个递增的序列号。

3. 核心机制

3.1. 会话管理

每个客户端与 ZooKeeper 集群之间建立一个会话,用于维持连接状态和管理临时节点。ZooKeeper 通过心跳机制检测客户端的连接状态,如果在一定时间内未收到心跳,认为会话断开。

3.2. 数据同步

为了保证各个节点的数据一致性,ZooKeeper 采用了数据同步机制。Leader 节点在处理写请求时,会将变更操作发送给所有 Follower 节点,Follower 节点在接受变更操作后进行确认,最终由 Leader 节点决定变更操作是否成功。

3.3. 通知机制

ZooKeeper 支持 Watch 机制,客户端可以在指定的 znode 上注册 Watch,当该 znode 的数据或子节点发生变更时,ZooKeeper 会通知客户端。

4. 一致性协议

ZooKeeper 使用一种称为 ZAB(Zookeeper Atomic Broadcast)的一致性协议来保证数据的一致性。ZAB 包括两个阶段:选举阶段和广播阶段。

4.1. 选举阶段

当 ZooKeeper 集群启动时,或 Leader 节点故障时,需要进行选举以确定新的 Leader。选举阶段主要分为以下几步:

  1. 投票:所有节点都投票给自己,并将投票发送给其他节点。
  2. 接收投票:各节点接收到其他节点的投票,并统计投票结果。
  3. 更新投票:如果接收到的投票中有票数比自己高的候选人,则更新投票给该候选人。
  4. 确定 Leader:当某个候选人获得超过半数以上的投票时,成为新的 Leader。
4.2. 广播阶段

在 Leader 确定后,进入广播阶段,Leader 负责处理客户端的写请求,并将变更操作广播给所有 Follower 节点。具体步骤如下:

  1. 提案:Leader 接收到写请求后,生成一个提案,并将提案发送给所有 Follower 节点。
  2. 确认:Follower 节点接收到提案后,进行日志记录,并向 Leader 发送确认消息。
  3. 提交:Leader 节点接收到超过半数以上的确认消息后,提交该提案,并将提交结果通知所有 Follower 节点。
  4. 应用变更:Follower 节点接收到提交通知后,应用变更操作。

5. 示例代码

下面是使用 ZooKeeper 的一个简单示例,展示如何创建节点、读取节点数据和注册 Watch。

5.1. 引入依赖

pom.xml 中引入 ZooKeeper 客户端依赖。

复制代码

xml复制代码

<dependency> <groupId>org.apache.zookeeper</groupId> <artifactId>zookeeper</artifactId> <version>3.6.3</version> </dependency>

5.2. 创建节点和读取数据
复制代码

java复制代码

import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Watcher; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.CreateMode; import org.apache.zookeeper.ZooDefs; import org.apache.zookeeper.KeeperException; import java.io.IOException; public class ZookeeperExample { private static final String ZK_ADDRESS = "localhost:2181"; private static final int SESSION_TIMEOUT = 3000; public static void main(String[] args) throws IOException, KeeperException, InterruptedException { // 创建 ZooKeeper 客户端 ZooKeeper zk = new ZooKeeper(ZK_ADDRESS, SESSION_TIMEOUT, new Watcher() { @Override public void process(WatchedEvent event) { System.out.println("Event: " + event.getType()); } }); // 创建节点 String path = "/example"; byte[] data = "Hello ZooKeeper".getBytes(); if (zk.exists(path, false) == null) { zk.create(path, data, ZooDefs.Ids.OPEN_ACL_UNSAFE, CreateMode.PERSISTENT); } // 读取节点数据 byte[] retrievedData = zk.getData(path, false, null); System.out.println("Data: " + new String(retrievedData)); // 注册 Watch zk.getData(path, new Watcher() { @Override public void process(WatchedEvent event) { System.out.println("WatchedEvent: " + event.getType()); } }, null); // 修改节点数据,触发 Watch zk.setData(path, "New Data".getBytes(), -1); // 关闭 ZooKeeper 客户端 zk.close(); } }

总结

ZooKeeper 作为一个分布式协调服务,通过其主从架构、树形数据模型、会话管理、数据同步、通知机制和 ZAB 一致性协议,提供了高可用和一致性的分布式协调服务。理解 ZooKeeper 的底层原理和实现,有助于更好地应用它来解决分布式系统中的一致性问题。

相关推荐
胡耀超24 分钟前
《设计数据密集型应用》(DDIA, 2nd ed.) 心智模型导览——《Designing Data-Intensive Applications》书介绍导航
大数据·数据库·分布式·ai·架构·数据
云游牧者44 分钟前
K8S-Helm包管理全解-从入门到Chart开发实战指南
云原生·容器·kubernetes·helm·chart模板
Elastic 中国社区官方博客2 小时前
一个查询,无限 Elasticsearch Serverless 项目:跨项目搜索介绍
大数据·elasticsearch·搜索引擎·信息可视化·云原生·serverless·全文检索
思诺学长2 小时前
从0理解Feed流系统:技术原理、架构设计与实战指南
云原生
程序员老邢2 小时前
《技术底稿 41》从三机混跑到四机隔离:微服务集群环境拆分实战复盘
微服务·云原生·架构·devops·服务器运维·技术底稿·环境隔离
Tony Bai3 小时前
Google 开源 AX 与 Agent Substrate:构建以 Agent 为核心的云原生计算底座
云原生·开源
shuair3 小时前
redis分布式锁
数据库·redis·分布式
song5013 小时前
昇腾 910 的硬件架构:为什么它适合跑大模型
图像处理·人工智能·分布式·flutter·硬件架构·交互
会编程的土豆3 小时前
Kafka 操作流程(零基础完整流程)
分布式·kafka
未若君雅裁4 小时前
分布式接口幂等性设计:唯一索引、Token 与分布式锁
分布式·微服务