Zookeeper面试题

ZK节点宕机如何处理?

  1. ZK服务的机制是只要存活节点超过半数就依然可以提供服务。少于一半的话集群会失效。
  2. 如果是Follower宕机,其他Follower上是有副本的,还可以继续提供服务。
  3. 如果是Leader宕机,Zookeeper会选举出新的Leader。

ZAB协议的核心内容?

ZAB协议分为崩溃恢复消息广播

  1. 当Leader节点出现宕机,崩溃的时候,就进入崩溃恢复模式,选举产生新的Leader。
  2. 当集群中的过半机器完成状态同步(数据同步)之后就会进入到消息广播模式
  3. 这时如果一台新的机器想要加入进来,就会先自动进入恢复模式,找到Leader服务,完成数据同步,完成之后就可以成为Follower一起参与到消息广播流程中。

状态切换

  1. 如果Leader宕机,重启。当集群中的Follower过半不能与Leader进行通信的时候,ZK集群会进入到崩溃恢复模式,发起新的一轮Leader选举和同步。

保证消息有序

  1. 在整个消息广播过程中,Leader会将每一个事务转换成proposal进行广播,在广播这个事务proposal之前,Leader会先为这个事务生成一个全局递增的唯一ID。称之为事务ID(zxid),由于ZAB协议保证按照严格的顺序性。因此每一个proposal都按照zxid的顺序来进行处理。

Zookeeper如何保证是如何保证事务的顺序一致性?

zookeeper采用了全局递增的事务id来标识,所有的proposal在提出的时候都会加上一个zxid,zxid是一个64位的数字,高32位是epoch(时期),用来标识Leader的周期,如果有新的Leader产生,epoch会递增,低32位用来自增计数。当新的proposal产生的时候会经历二阶段提交过程,首先会向其他server发送事务请求,当过半的server都能够执行并且执行成功的时候,那么就开始执行。

相关推荐
水木流年追梦20 小时前
大模型入门-大模型分布式训练2
开发语言·分布式·python·算法·正则表达式·prompt
松☆21 小时前
torchtitan-npu:7B大模型在8卡NPU上的分布式训练实录
分布式
用户15583199681421 小时前
文件同步冲突技术根因与解决方案:Last-Write-Wins、OT、CRDT对比
云原生
青云计划1 天前
看门狗机制:从锁过期到自动续期的工程实践——Redisson分布式锁的生命线
分布式
ZPC82101 天前
DGX Spark 200G 跟 100G 设备的通讯协议
大数据·分布式·spark
水木流年追梦1 天前
大模型入门-大模型分布式训练1
开发语言·分布式·python·算法·正则表达式·prompt
AllData公司负责人1 天前
亲测丝滑,体验跃迁|AllData通过集成开源项目DataVines,一站式解决数据质量难题
java·大数据·数据结构·数据库·人工智能·算法·云原生
ULIi096kr1 天前
Redis 分布式锁进阶第七十二篇
数据库·redis·分布式
云祺vinchin1 天前
云祺&南大通用:打造分布式数据库建设与灾备方案
数据库·分布式·数据安全
bn9jBl6481 天前
Redis 分布式锁进阶第七十七篇
数据库·redis·分布式