ZooKeeper 是一个由 Apache 开源的分布式协调服务,专门为分布式系统提供高效、可靠的协同管理功能。它通过简单的接口和高效的设计,帮助开发者解决分布式环境中的常见问题,如配置管理、服务注册与发现、分布式锁、集群选举等。
核心概念与功能
- 数据模型(Znode)
ZooKeeper 的数据结构类似文件系统的树形目录,每个节点称为 Znode 。Znode 可以存储少量数据(默认不超过 1MB),并分为两种类型:
-
持久节点 :手动创建和删除,长期存在。
-
临时节点 :与客户端会话绑定,会话结束自动删除(常用于服务注册)。
-
顺序节点:节点名自动附加全局唯一递增序号(如 `/lock-0000000001`)。
- Watcher 监听机制
客户端可以监听 Znode 的变化(如数据更新、子节点增减),当事件触发时,ZooKeeper 会实时通知客户端,实现分布式系统的动态感知。
- 一致性保证
ZooKeeper 基于 ZAB 协议(ZooKeeper Atomic Broadcast) ,确保集群中所有节点的数据强一致性:
-
所有写操作由 Leader 节点协调,通过多数节点(Quorum)确认后生效。
-
读操作可直接从任意节点获取数据,保证高吞吐。
- 高可用性
ZooKeeper 集群通常由多个节点(建议奇数个,如 3、5 个)组成,只要半数以上节点存活,服务即可正常运行。
典型应用场景
- 配置管理
将系统的配置信息(如数据库地址)存储在 Znode 中,所有服务监听该节点,配置变更时自动同步。
- 分布式锁
通过创建临时顺序节点实现排他锁或共享锁,协调多进程对共享资源的访问。
- 服务注册与发现
服务启动时注册为临时节点,宕机时自动移除。客户端通过监听节点列表动态发现可用服务。
- 领导者选举(Leader Election)
在集群中通过竞争创建临时节点,成功创建的节点成为 Leader,其他节点作为 Follower 并监听 Leader 状态。
优势与特点
-
简单易用 :提供类似文件系统的 API(如 `create`, `delete`, `exists`)。
-
高可靠性 :数据持久化到磁盘,通过集群保证高可用。
-
顺序一致性 :所有操作按全局顺序执行。
-
轻量高效:适用于高频率读、低频率写的场景。
常见使用案例
-
Apache Kafka :依赖 ZooKeeper 管理 Broker 元数据、Topic 配置和消费者组。
-
Hadoop/HBase :用于集群协调、主节点选举。
-
Dubbo:作为注册中心管理服务提供者与消费者。
总结
ZooKeeper 是分布式系统的"基石",通过统一的协调服务简化了复杂分布式逻辑的实现。尽管后来出现了 Etcd、Consul 等替代方案,ZooKeeper 仍因其成熟稳定被广泛应用于大型系统中。