ZooKeeper 的工作原理可以概括为以下几个方面:
- 数据模型
ZooKeeper 使用树形目录节点(znode)来建模关键的数据,每个 znode 可以存储数据内容,也可以作为目录包括子节点。客户端可以在节点上设置监听器。
- 一致性算法
ZooKeeper 使用 ZAB(ZooKeeper Atomic Broadcast)协议来保证分布式数据的一致性,基于状态机以原子广播的方式提交更改。
- 角色
ZooKeeper 集群有 Leader、Follower 和 Observer 三种角色,Leader 负责投票的发起和决议,Follower 需要响应并同步 Leader 的状态变更。
- 写操作处理
客户端的写请求会被转发给 Leader 节点,Leader 生成事务提案并使用 ZAB 协议广播给所有 Follower 节点,获得半数以上节点的确认后即可提交。
- 读操作处理
客户端可以从任意的 Follower 节点读取数据,如果该节点的数据副本不是最新的,则会导致读取旧数据,ZooKeeper 会使用一致性协议来修复它。
- 节点类型
ZooKeeper 支持持久节点、临时节点、序列节点等不同类型,用于表示不同的业务语义。
- 通知机制
客户端可以在节点上注册 Watcher 监听器,当该节点状态发生变化时,会触发注册的回调函数,实现分布式通知。
- 会话管理
ZooKeeper 为每个客户端维护一个会话,有心跳检测机制,如果长时间没有收到心跳包,则表明客户端会话失效。