Zookeeper应用场景和底层设计

一、什么是zookeeper

Zookeeper是一个开源的分布式协调服务框架,它是服务于其它集群式框架的框架。

【简言之】

有一个服务A,以集群的方式提供服务。只需要A专注于它提供的服务就可以,至于它如何以多台服务器协同完成任务的事情,交给Zookeeper来协调。

【底层设计逻辑】

1)基于观察者 设计模式

2)等价于文件系统 +通知机制

【数据存储的方式】

zookeeper是文件系统,当然是像树一样的结构存储

1)每个节点都有唯一路径标识

2)每个节点默认只能存储1M数据

【zookeeper运行规则】

1)支持一个leader,多个follower组成的集群方式运行

2)集群中半数以上节点存活,zookeeper就能提供正常的服务

3)集群中的每个服务器上保存的数据都完全相同,具有数据一致性

4)同一个客户端的请求会按照请求的顺序执行

5) 数据更新具有原子性,要么全部更新成功,要么不更新

【zookeeper中节点类型】
是否持久(-e参数)

1)持久型:客户端与服务器端断开连接后,创建节点不删除create /nodename

2)短暂型:客户端与服务器端断开连接后,创建节点自己删除create -e /nodename
是否有序列号(-s参数)

1)有create -s /nodename: /nodename0000000003 可依据序号进行全局的事务排序

2)无create /nodename: /nodename
容器节点

1)当子节点都不存在后,容器节点就会自动消失
TTL节点

1)当超过时间,自动消失

【zookeeper中节点信息】

1)存储的数据信息

2)路径信息

3)节点的元数据

4)子节点信息

二、zookeeper应用场景

1、统一命名:唯一名称标识
2、统一配置管理:所有节点配置信息一致、更新后快速更新到各个节点上
3、统一集群管理:每一个节点可以立即感知到其它节点的变化
4、 服务器节点动态上下线
5、软负载均衡

三、zookeeper中相关的底层原理

1、选举机制

集群的机器数量是奇数还是偶数?

答:当然是奇数好,不然容易平票

怎样一种情况表示选举成功?

答:投票数最先超过半数的机器成为leader,不论先来后到

机器状态有哪些?

1)looking:选举态

2)leading:当官态,正常工作态

3)following:随从态,正常工作态

选票格式是什么样的,如何比较各个信息?

答:每一张选票上包含三个信息

1)epoch:参加过几次选举

2)zxid:最大事务ID

3)sid:服务器编号

按照顺序依次比较,谁大选谁

什么时候开始选举?

答:分两种情况

【情况1------zookeeper集群搭建过程中】

在没有选出leader之前都处于looking状态,并且新加进来一个机器就组织一次选举直到选出leader,后面新加进来的机器都是follower。

【情况2------集群运行过程中,leader"挂掉了"】

如果是某个follower认为leader挂掉了,实际上leader在正常工作。这种情况下,不会进行选举,只是要求该follower不断尝试与leader获取连接直到成功。

如果leader真的挂掉了,会在所有正常工作的follower中安装选票信息进行重新选举。

如何判断leader是否挂掉了?

答:在工作过程中,leader会发送带有ping的信息给follower,当follower一段时间内没有读取到该信息,就可以任务该leader挂掉了。

2、CAP理论

CAP分别是指一致性(Consistency),可用性(Consistency)和分区容忍性(Partition tolerance):

  • 一致性:数据保持强一致性
  • 可用性:服务器可提供完备的服务
  • 分区容忍性:容灾,分区存备份
相关推荐
不太灵光的程序员6 分钟前
【HBase分布式数据库】第七章 数据的导入导出 importtsv导入数据
数据库·分布式·hbase
Acrel_WPP1 小时前
分布式光伏智慧平台建设现场 系统集成商如何盈利
分布式
大山同学1 小时前
DPGO:异步和并行分布式位姿图优化 2020 RA-L best paper
人工智能·分布式·语言模型·去中心化·slam·感知定位
Lyqfor3 小时前
云原生学习
java·分布式·学习·阿里云·云原生
流雨声3 小时前
2024-09-01 - 分布式集群网关 - LoadBalancer - 阿里篇 - 流雨声
分布式
floret*4 小时前
用pyspark把kafka主题数据经过etl导入另一个主题中的有关报错
分布式·kafka·etl
william8234 小时前
Information Server 中共享开源服务中 kafka 的__consumer_offsets目录过大清理
分布式·kafka·开源
P.H. Infinity4 小时前
【RabbitMQ】10-抽取MQ工具
数据库·分布式·rabbitmq
Smile丶凉轩5 小时前
微服务即时通讯系统的实现(客户端)----(1)
微服务·云原生·架构
南慕小白5 小时前
云原生后端
云原生