ZooKeeper 数据模型

ZooKeeper 数据模型

ZooKeeper 拥有层次化的命名空间,类似分布式文件系统,但每个节点不仅能有子节点,还可关联数据。节点路径为规范的绝对路径,用斜杠分隔,无相对引用。路径命名有如下约束:

  • 路径名不能包含空字符 \u0000
  • 不能使用显示不佳或易混淆的字符,如 \u0001 - \u001F\u007F\u009F
  • 禁止使用 \ud800 - \uF8FF\uFFF0 - \uFFFF 这些字符。
  • 虽然 . 可作为其他名称的一部分,但 ... 不能单独用于表示路径中的节点,因为 ZooKeeper 不使用相对路径。
  • 保留关键字 zookeeper 不可用。

1. ZNodes(ZooKeeper 节点)

  • 状态结构(Stat Structure):每个 ZNode 维护一个状态结构,包含数据变更、ACL 变更的版本号以及时间戳。版本号和时间戳用于验证缓存和协调更新。每次 ZNode 数据变更,版本号都会增加。客户端更新或删除数据时需提供版本号,若版本号不匹配,操作将失败(该行为可被覆盖)。
  • 节点角色定义:在 ZooKeeper 文档中,ZNode 指数据节点;服务器指构成 ZooKeeper 服务的机器;法定节点指构成集群的服务器;客户端指使用 ZooKeeper 服务的主机或进程。

2. Watches(监听机制)

客户端可对 ZNode 设置监听,ZNode 发生变化时触发监听并清除。监听触发后,ZooKeeper 会向客户端发送通知。

3. 数据访问

  • 原子性:命名空间中每个 ZNode 存储的数据读写是原子操作,读操作获取所有关联数据字节,写操作替换所有数据。
  • 访问控制:每个节点有访问控制列表(ACL),用于限制访问权限。
  • 数据规模:ZooKeeper 并非通用数据库或大对象存储,主要管理协调数据,数据通常较小(以千字节为单位)。客户端和服务器实现会检查确保 ZNode 数据小于 1M,实际数据应更小。处理大数据会增加操作时间和影响延迟,若需存储大数据,可将其存于 NFS 或 HDFS 等大容量存储系统,在 ZooKeeper 中存储指向这些存储位置的指针。

4. 特殊类型的 ZNodes

  • 临时节点(Ephemeral Nodes) :只要创建该 ZNode 的会话处于活动状态,临时节点就存在。会话结束,ZNode 会被删除,且临时节点不允许有子节点。可使用 getEphemerals() API 获取会话创建的临时节点列表,常用于服务发现场景。
  • 顺序节点(Sequence Nodes) :创建 ZNode 时,可要求 ZooKeeper 在路径末尾添加单调递增的计数器,该计数器对父节点唯一,格式为 %010d(10 位数字,前补 0)。计数器是父节点维护的有符号整数(4 字节),超过 2147483647 会溢出。
  • 容器节点(Container Nodes,3.6.0 版本引入) :用于特定场景,如领导者选举、锁机制等。当容器的最后一个子节点被删除,容器节点未来某个时刻可能被服务器删除。创建容器节点的子节点时,要处理 KeeperException.NoNodeException 异常,若发生该异常需重新创建容器节点。
  • TTL 节点(TTL Nodes,3.6.0 版本引入) :创建持久或持久顺序 ZNode 时,可选择设置以毫秒为单位的 TTL。若 ZNode 在 TTL 内未被修改且无子节点,未来某个时刻可能被服务器删除。默认情况下 TTL 节点功能禁用,需通过系统属性启用,否则创建时会抛出 KeeperException.UnimplementedException 异常。

5. ZooKeeper 中的时间跟踪

  • Zxid(ZooKeeper 事务 ID) :ZooKeeper 状态的每次变更都会获得一个 Zxid 标记,体现所有变更的全局顺序。每个变更有唯一 Zxid,若 zxid1 < zxid2,则 zxid1 变更先于 zxid2 变更发生。
  • 版本号 :节点的每次变更会使节点的某个版本号增加,包括数据版本号(version)、子节点版本号(cversion)和 ACL 版本号(aversion)。
  • Ticks:多服务器模式下,服务器用 Ticks 定义事件时间,如状态上传、会话超时、节点间连接超时等。Tick 时间通过最小会话超时(2 倍 Tick 时间)间接暴露,若客户端请求的会话超时小于最小会话超时,服务器会将实际会话超时设为最小会话超时。
  • 实时时间:ZooKeeper 仅在 ZNode 创建和修改时在状态结构中记录时间戳,不使用实时时间。

6. ZooKeeper 状态结构(Stat Structure)

每个 ZNode 的状态结构包含以下字段:

  • czxid:创建该 ZNode 的变更的 Zxid。
  • mzxid:最后修改该 ZNode 的变更的 Zxid。
  • pzxid:最后修改该 ZNode 子节点的变更的 Zxid。
  • ctime:该 ZNode 创建的时间(从纪元开始的毫秒数)。
  • mtime:该 ZNode 最后修改的时间(从纪元开始的毫秒数)。
  • version:该 ZNode 数据的变更次数。
  • cversion:该 ZNode 子节点的变更次数。
  • aversion:该 ZNode ACL 的变更次数。
  • ephemeralOwner:若该 ZNode 是临时节点,为其所有者会话 ID;否则为 0。
  • dataLength:该 ZNode 数据字段的长度。
  • numChildren:该 ZNode 的子节点数量。
相关推荐
心随雨下20 分钟前
Redis中Geospatial 实际应用指南
数据库·redis·分布式·缓存
小北爱编程ma27 分钟前
【云原生】用Prometheus Operator监听Golang服务指标,并用Granafa可视化展示
云原生
NineData44 分钟前
NineData云原生智能数据管理平台新功能发布|2025年9月版
数据库·云原生·devops·ninedata·数据库迁移·数据复制·风险sql管控
想你依然心痛3 小时前
Spark大数据分析与实战笔记(第六章 Kafka分布式发布订阅消息系统-01)
笔记·分布式·spark
故事很腻i3 小时前
安装kafka-2.5.1
分布式·kafka
hello_2505 小时前
k8s opa集成
云原生·容器·kubernetes
大数据CLUB5 小时前
基于spark的抖音短视频数据分析及可视化
大数据·hadoop·分布式·数据分析·spark
yumgpkpm5 小时前
大数据综合管理平台(CMP)(类Cloudera CDP7.3)有哪些核心功能?
hive·hadoop·elasticsearch·zookeeper·big data
老友@7 小时前
集中式架构、分布式架构与微服务架构全面解析
分布式·微服务·架构·系统架构
前端世界7 小时前
从0到1实现鸿蒙智能设备状态监控:轻量级架构、分布式同步与MQTT实战全解析
分布式·架构·harmonyos