Zookeeper面试题

ZK节点宕机如何处理?

  1. ZK服务的机制是只要存活节点超过半数就依然可以提供服务。少于一半的话集群会失效。
  2. 如果是Follower宕机,其他Follower上是有副本的,还可以继续提供服务。
  3. 如果是Leader宕机,Zookeeper会选举出新的Leader。

ZAB协议的核心内容?

ZAB协议分为崩溃恢复消息广播

  1. 当Leader节点出现宕机,崩溃的时候,就进入崩溃恢复模式,选举产生新的Leader。
  2. 当集群中的过半机器完成状态同步(数据同步)之后就会进入到消息广播模式
  3. 这时如果一台新的机器想要加入进来,就会先自动进入恢复模式,找到Leader服务,完成数据同步,完成之后就可以成为Follower一起参与到消息广播流程中。

状态切换

  1. 如果Leader宕机,重启。当集群中的Follower过半不能与Leader进行通信的时候,ZK集群会进入到崩溃恢复模式,发起新的一轮Leader选举和同步。

保证消息有序

  1. 在整个消息广播过程中,Leader会将每一个事务转换成proposal进行广播,在广播这个事务proposal之前,Leader会先为这个事务生成一个全局递增的唯一ID。称之为事务ID(zxid),由于ZAB协议保证按照严格的顺序性。因此每一个proposal都按照zxid的顺序来进行处理。

Zookeeper如何保证是如何保证事务的顺序一致性?

zookeeper采用了全局递增的事务id来标识,所有的proposal在提出的时候都会加上一个zxid,zxid是一个64位的数字,高32位是epoch(时期),用来标识Leader的周期,如果有新的Leader产生,epoch会递增,低32位用来自增计数。当新的proposal产生的时候会经历二阶段提交过程,首先会向其他server发送事务请求,当过半的server都能够执行并且执行成功的时候,那么就开始执行。

相关推荐
AI攻城狮12 小时前
RAG Chunking 为什么这么难?5 大挑战 + 最佳实践指南
人工智能·云原生·aigc
回家路上绕了弯2 天前
深入解析Agent Subagent架构:原理、协同逻辑与实战落地指南
分布式·后端
哈里谢顿2 天前
Kubernetes Operator核心概念、实现原理和实战开发
云原生
阿里云云原生2 天前
你的 OpenClaw 真的在受控运行吗?
云原生
阿里云云原生2 天前
5 分钟零代码改造,让 Go 应用自动获得全链路可观测能力
云原生·go
Shanyoufusu123 天前
RKE2 单节点集群安装 Rancher+ 私有镜像仓库搭建 完整教程
云原生
阿里云云原生3 天前
Dify 官方上架 Higress 插件,轻松接入 AI 网关访问模型服务
云原生
初次攀爬者3 天前
Kafka + ZooKeeper架构基础介绍
后端·zookeeper·kafka
AI攻城狮3 天前
OpenClaw Session 管理完全指南:Context 压缩、重置与持久化
人工智能·云原生·aigc
阿里云云原生7 天前
阿里云获评 Agentic AI 开发平台领导者,函数计算 AgentRun 赢下关键分!
云原生