Zookeeper应用场景和底层设计

一、什么是zookeeper

Zookeeper是一个开源的分布式协调服务框架,它是服务于其它集群式框架的框架。

【简言之】

有一个服务A,以集群的方式提供服务。只需要A专注于它提供的服务就可以,至于它如何以多台服务器协同完成任务的事情,交给Zookeeper来协调。

【底层设计逻辑】

1)基于观察者 设计模式

2)等价于文件系统 +通知机制

【数据存储的方式】

zookeeper是文件系统,当然是像树一样的结构存储

1)每个节点都有唯一路径标识

2)每个节点默认只能存储1M数据

【zookeeper运行规则】

1)支持一个leader,多个follower组成的集群方式运行

2)集群中半数以上节点存活,zookeeper就能提供正常的服务

3)集群中的每个服务器上保存的数据都完全相同,具有数据一致性

4)同一个客户端的请求会按照请求的顺序执行

5) 数据更新具有原子性,要么全部更新成功,要么不更新

【zookeeper中节点类型】
是否持久(-e参数)

1)持久型:客户端与服务器端断开连接后,创建节点不删除create /nodename

2)短暂型:客户端与服务器端断开连接后,创建节点自己删除create -e /nodename
是否有序列号(-s参数)

1)有create -s /nodename: /nodename0000000003 可依据序号进行全局的事务排序

2)无create /nodename: /nodename
容器节点

1)当子节点都不存在后,容器节点就会自动消失
TTL节点

1)当超过时间,自动消失

【zookeeper中节点信息】

1)存储的数据信息

2)路径信息

3)节点的元数据

4)子节点信息

二、zookeeper应用场景

1、统一命名:唯一名称标识
2、统一配置管理:所有节点配置信息一致、更新后快速更新到各个节点上
3、统一集群管理:每一个节点可以立即感知到其它节点的变化
4、 服务器节点动态上下线
5、软负载均衡

三、zookeeper中相关的底层原理

1、选举机制

集群的机器数量是奇数还是偶数?

答:当然是奇数好,不然容易平票

怎样一种情况表示选举成功?

答:投票数最先超过半数的机器成为leader,不论先来后到

机器状态有哪些?

1)looking:选举态

2)leading:当官态,正常工作态

3)following:随从态,正常工作态

选票格式是什么样的,如何比较各个信息?

答:每一张选票上包含三个信息

1)epoch:参加过几次选举

2)zxid:最大事务ID

3)sid:服务器编号

按照顺序依次比较,谁大选谁

什么时候开始选举?

答:分两种情况

【情况1------zookeeper集群搭建过程中】

在没有选出leader之前都处于looking状态,并且新加进来一个机器就组织一次选举直到选出leader,后面新加进来的机器都是follower。

【情况2------集群运行过程中,leader"挂掉了"】

如果是某个follower认为leader挂掉了,实际上leader在正常工作。这种情况下,不会进行选举,只是要求该follower不断尝试与leader获取连接直到成功。

如果leader真的挂掉了,会在所有正常工作的follower中安装选票信息进行重新选举。

如何判断leader是否挂掉了?

答:在工作过程中,leader会发送带有ping的信息给follower,当follower一段时间内没有读取到该信息,就可以任务该leader挂掉了。

2、CAP理论

CAP分别是指一致性(Consistency),可用性(Consistency)和分区容忍性(Partition tolerance):

  • 一致性:数据保持强一致性
  • 可用性:服务器可提供完备的服务
  • 分区容忍性:容灾,分区存备份
相关推荐
眠りたいです2 小时前
基于脚手架微服务的视频点播系统-数据管理与网络通信部分的预备工作
c++·qt·ui·微服务·云原生·架构·媒体
Hello.Reader3 小时前
Kafka 实现从网络层到日志与位点的“全景拆解”
分布式·kafka
我是苏苏4 小时前
KafKa02:Kafka配置文件server.properties介绍
分布式·kafka
Dobby_054 小时前
【Hadoop】Yarn:Hadoop 生态的资源操作系统
大数据·hadoop·分布式·yarn
笨蛋少年派4 小时前
安装Hadoop中遇到的一些问题和解决
大数据·hadoop·分布式
虫小宝4 小时前
返利软件的分布式缓存架构:Redis集群在高并发场景下的优化策略
分布式·缓存·架构
在未来等你4 小时前
Kafka面试精讲 Day 18:磁盘IO与网络优化
大数据·分布式·面试·kafka·消息队列
lifallen4 小时前
字节跳动Redis变种Abase:无主多写架构如何解决高可用难题
数据结构·redis·分布式·算法·缓存
梓仁沐白5 小时前
hadoop单机伪分布环境配置
大数据·hadoop·分布式
linweidong6 小时前
解锁 Ray 在 Kubernetes 上的弹性伸缩:打造高效、稳定的分布式作业
分布式·容器·kubernetes·ray·keda·autoscaling·ray推理