Zookeeper复习

一、入门

1、概念

zookeeper=文件系统+通知机制

2.特点

1）、一个领导者，多个跟随者组成的集群。

2）、集群中只要有半数以上存活机制，zookeeper集群能正产服务。zk适合安装奇数台。

3）、全局数据一致：每个Server保存一份相同的数据副本，client无论连接到哪个server,数据都是一致的。

4）、更新请求顺序：按来自同一个Client的更新请求，先进先出。

5）、数据更新原子性，一次数据更新要么成功，要么失败。

6）、实时性，在一定时间内，client能读到最新数据（zk同步数据比较快）。

3、数据结构

zookeeper数据模型与Unix文件系统很类似；

4、应用场景

1）、统一命令服务

2）、统一配置管理

①、一般要求一个集群中，所有节点的配置信息是一致的，比如kafka集群；

②、对配置文件后，尽快同步到各个节点上；

配置管理可交由Zookeeper实现。可将配置信息写到Zookeeper上的一个Znode。各个客户端服务器监听这个Znode.

3)、软负载均衡

在zookeeper中记录每台服务器的访问数，让访问数最少的服务器最处理最新的客户端请求；

5、官网地址

https://zookeeper.apache.org/

二、Zookeeper本地安装

2.1 本地模式安装部署

1 ）安装前准备

（1）安装Jdk

（2）拷贝Zookeeper安装包到Linux系统下

（3）解压到指定目录

$atguigu@hadoop102 software$ $ tar -zxvf zookeeper-3.5.7.tar.gz -C /opt/module/

2 ）配置修改

（1）将/opt/module/zookeeper-3.5.7/conf这个路径下的zoo_sample.cfg修改为zoo.cfg；

$atguigu@hadoop102 conf$ $ mv zoo_sample.cfg zoo.cfg

（2）打开zoo.cfg文件，修改dataDir路径：

$atguigu@hadoop102 zookeeper-3.5.7$ $ vim zoo.cfg

修改如下内容：

dataDir=/opt/module/zookeeper-3.5.7/zkData

（3）在/opt/module/zookeeper-3.5.7/这个目录上创建zkData文件夹

$atguigu@hadoop102 zookeeper-3.5.7$ $ mkdir zkData

3 ）操作Zookeeper

（1）启动Zookeeper

$atguigu@hadoop102 zookeeper-3.5.7$ $ bin/zkServer.sh start

（2）查看进程是否启动

$atguigu@hadoop102 zookeeper-3.5.7$ $ jps

4020 Jps

4001 QuorumPeerMain

（3）查看状态：

$atguigu@hadoop102 zookeeper-3.5.7$ $ bin/zkServer.sh status

ZooKeeper JMX enabled by default

Using config: /opt/module/zookeeper-3.5.7/bin/../conf/zoo.cfg

Mode: standalone

（4）启动客户端：

$atguigu@hadoop102 zookeeper-3.5.7$ $ bin/zkCli.sh

（5）退出客户端：

$zk: localhost:2181(CONNECTED) 0$ quit

（6）停止Zookeeper

$atguigu@hadoop102 zookeeper-3.5.7$ $ bin/zkServer.sh stop

2.2 配置参数解读

Zookeeper中的配置文件zoo.cfg中参数含义解读如下：

1 ） tickTime =2000 ： 通信心跳数 ， Zookeeper服务器 与 客户端心跳时间，单位毫秒

Zookeeper使用的基本时间，服务器之间或客户端与服务器之间维持心跳的时间间隔，也就是每个tickTime时间就会发送一个心跳，时间单位为毫秒。

它用于心跳机制，并且设置最小的session超时时间为两倍心跳时间。(session的最小超时时间是2*tickTime)

2） initLimit =10 ： LF初始通信时限

集群中的Follower跟随者服务器与Leader领导者服务器之间初始连接时能容忍的最多心跳数（tickTime的数量），用它来限定集群中的Zookeeper服务器连接到Leader的时限。

3） syncLimit =5：LF同步通信时限

集群中Leader与Follower之间的最大响应时间单位 ，假如响应超过syncLimit * tickTime，Leader认为Follwer死掉，从服务器列表中删除Follwer。

4） dataDir：数据文件目录+数据持久化路径

主要用于保存Zookeeper中的数据。

5） clientPort =2181：客户端连接端口

监听客户端连接的端口。

三、Zookeeper集群操作

3 .1 集群操作

3 .1.1 集群安装

1）集群规划

在hadoop102、hadoop103和hadoop104三个节点上都部署Zookeeper。

思考：如果是10台服务器，需要部署多少台Zookeeper？

2）解压安装

（1）在hadoop102解压Zookeeper安装包到/opt/module/目录下

$atguigu@hadoop102 software$ $ tar -zxvf apache-zookeeper-3.7.1-bin.tar.gz -C /opt/module/

（2）修改apache-zookeeper-3.7.1-bin名称为zookeeper-3.7.1

$atguigu@hadoop102 module$ $ mv apache-zookeeper-3.7.1-bin/ zookeeper-3.7.1

3）配置服务器编号

（1）在/opt/module/zookeeper-3.7.1/这个目录下创建zkData

$atguigu@hadoop102 zookeeper-3.7.1$ $ mkdir zkData

（2）在/opt/module/zookeeper-3.7.1/zkData目录下创建一个myid的文件

$atguigu@hadoop102 zkData$ $ vi myid

在文件中添加与server对应的编号（注意：上下不要有空行，左右不要有空格）。

注意：添加myid文件，一定要在Linux里面创建，在notepad++里面很可能乱码。

（3）拷贝配置好的zookeeper到其他机器上

$atguigu@hadoop102 module$ $ xsync zookeeper-3.7.1

并分别在hadoop103、hadoop104上修改myid文件中内容为3、4。

4 ）配置zoo.cfg文件

（1）重命名/opt/module/zookeeper-3.7.1/conf这个目录下的zoo_sample.cfg为zoo.cfg

$atguigu@hadoop102 conf$ $ mv zoo_sample.cfg zoo.cfg

（2）打开zoo.cfg文件

$atguigu@hadoop102 conf$ $ vim zoo.cfg

#修改数据存储路径配置

dataDir=/opt/module/zookeeper-3.7.1/zkData

#增加如下配置

#######################cluster##########################

server.2=hadoop102:2888:3888

server.3=hadoop103:2888:3888

server.4=hadoop104:2888:3888

几号服务器=服务器地址：服务器交换信息端口：执行选举时服务器相互通信的端口

（3）配置参数解读

server.A=B:C:D。

A是一个数字，表示这个是第几号服务器；

集群模式下配置一个文件myid，这个文件在dataDir目录下，这个文件里面有一个数据就是A的值，Zookeeper启动时读取此文件，拿到里面的数据与zoo.cfg里面的配置信息比较从而判断到底是哪个server。

B是这个服务器的地址；

C是这个服务器Follower与集群中的Leader服务器交换信息的端口；

D是万一集群中的Leader服务器挂了，需要一个端口来重新进行选举，选出一个新的Leader，而这个端口就是用来执行选举时服务器相互通信的端口。

（4）同步zoo.cfg配置文件

$atguigu@hadoop102 conf$ $ xsync zoo.cfg

5 ）集群操作

（1）分别启动Zookeeper

$atguigu@hadoop102 zookeeper-3.7.1$ $ bin/zkServer.sh start

$atguigu@hadoop103 zookeeper-3.7.1$ $ bin/zkServer.sh start

$atguigu@hadoop104 zookeeper-3.7.1$ $ bin/zkServer.sh start

（2）查看状态

$atguigu@hadoop102 zookeeper-3.7.1$ # bin/zkServer.sh status

JMX enabled by default

Using config: /opt/module/zookeeper-3.7.1/bin/../conf/zoo.cfg

Mode: follower

$atguigu@hadoop103 zookeeper-3.7.1$ # bin/zkServer.sh status

JMX enabled by default

Using config: /opt/module/zookeeper-3.7.1/bin/../conf/zoo.cfg

Mode: leader

$atguigu@hadoop104 zookeeper-3.4.5$ # bin/zkServer.sh status

JMX enabled by default

Using config: /opt/module/zookeeper-3.7.1/bin/../conf/zoo.cfg

Mode: follower

3.1.2 选举机制（重点）

zk第一次启动

非第一次启动

选举Leader规则：①EPOCH大的直接胜出 ②EPOCH相同时，ZXID（事务id）大的胜出

③ 事务id相同，服务器id大的胜出

3.1.3 ZK 集群启动停止脚本

（1）在hadoop102的/home/atguigu/bin目录下创建脚本

$atguigu@hadoop102 bin$ $ vim zk.sh

在脚本中编写如下内容

#!/bin/bash

case $1 in

"start"){

for i in hadoop102 hadoop103 hadoop104

echo ---------- zookeeper $i 启动 ------------

ssh $i "/opt/module/zookeeper-3.7.1/bin/zkServer.sh start"

done

};;

"stop"){

for i in hadoop102 hadoop103 hadoop104

echo ---------- zookeeper $i 停止 ------------

ssh $i "/opt/module/zookeeper-3.7.1/bin/zkServer.sh stop"

done

};;

"status"){

for i in hadoop102 hadoop103 hadoop104

echo ---------- zookeeper $i 状态 ------------

ssh $i "/opt/module/zookeeper-3.7.1/bin/zkServer.sh status"

done

};;

esac

（2）增加脚本执行权限

$atguigu@hadoop102 bin$ $ chmod u+x zk.sh

（3）Zookeeper集群启动脚本

$atguigu@hadoop102 module$ $ zk.sh start

（4）Zookeeper集群停止脚本

$atguigu@hadoop102 module$ $ zk.sh stop

启动zk客户端：

①、先启动zk.sh start

②、bin/zkCli.sh -server hadoop102:2181

3.2客户端命令行操作

3.2 .1 命令行语法

|----------------|-----------------------------------------------------|
| 命令基本语法 | 功能描述 |
| help | 显示所有操作命令 |
| ls path | 使用 ls 命令来查看当前znode的子节点 $可监听$ -w 监听子节点变化 -s 附加次级信息 |
| create | 普通创建 -s 含有序列 -e 临时（重启或者超时消失） |
| get path | 获得节点的值 $可监听$ -w 监听节点内容变化 -s 附加次级信息 |
| set | 设置节点的具体值 |
| stat | 查看节点状态 |
| delete | 删除节点 |
| deleteall | 递归删除节点 |

1 ）启动客户端
$atguigu@hadoop102 zookeeper-3.5.7$ $ bin/zkCli.sh -server
hadoop102:2181
2 ）显示所有操作命令
$zk: hadoop102:2181(CONNECTED) 1$ help

3.2.2 znode节点数据信息

1 ）查看当前 znode 中所包含的内容
$zk: hadoop102:2181(CONNECTED) 0$ ls /

zookeeper

2 ）查看当前节点详细数据
$zk: hadoop102:2181(CONNECTED) 5$ ls -s /

3.2.3节点类型（持久/短暂/有序号/无序号）

1 ）分别创建 2 个普通节点（永久节点 + 不带序号）
$zk: localhost:2181(CONNECTED) 3$ create /sanguo "diaochan"
Created /sanguo
$zk: localhost:2181(CONNECTED) 4$ create /sanguo/shuguo
"liubei"
Created /sanguo/shuguo
注意：创建节点时，要赋值
2 ）获得节点的值
$zk: localhost:2181(CONNECTED) 5$ get -s /sanguo

一、入门

1、概念

2.特点

3、数据结构

4、应用场景

1）、统一命令服务

2）、统一配置管理

3)、软负载均衡

5、官网地址

二、Zookeeper本地安装

2.1 本地模式 安装部署

1 ） 安装前准备

2 ）配置修改

3 ） 操作Zookeeper

2.2 配置参数解读

三、Zookeeper集群操作

3 .1 集群操作

3 .1.1 集群安装

1）集群 规划

2） 解压安装

****3）配置服务器编号

4 ）配置zoo.cfg文件

5 ） 集群操作

（1）分别启动Zookeeper

（2）查看状态

3.1.2 选举机制（重点）

3.1.3 ZK 集群启动停止脚本

（1）在hadoop102的/home/atguigu/bin目录下创建脚本

（2）增加脚本执行权限

（3）Zookeeper集群启动脚本

（4）Zookeeper集群停止脚本

3.2****客户端命令行操作

3.2 .1 命令行语法

3.2.2 znode****节点数据信息

**3.2.3节点类型（持久/短暂/有序号/**无序号）

2.1 本地模式安装部署

1 ）安装前准备

3 ）操作Zookeeper

1）集群规划

2）解压安装

3）配置服务器编号

5 ）集群操作

3.2客户端命令行操作

3.2.2 znode节点数据信息

3.2.3节点类型（持久/短暂/有序号/无序号）