在如今这样的分布式系统和云计算的时代，构建可靠、高性能的分布式服务是各个领域不可缺失的一部分。在这个领域里，zookeeper作为java中非常知名的中间件，一直以来都扮演着一个关键的角色。

接下来，我决定写一系列关于zookeeper源码分析的文章，对zookeeper的源码进行深度解读。

为什么要进行ZooKeeper源码分析？

1、深刻理解分布式系统基础理论：ZooKeeper是分布式系统领域的一个经典实现，通过深度源码解析，我们可以更好地理解分布式系统中的关键概念和原理，为设计和构建分布式系统打下坚实基础。

2、学习设计模式和优秀编程实践：ZooKeeper的源码体现了许多设计模式和良好的编程实践。通过学习这些，我们可以汲取宝贵的经验，提高我们自己的编程水平。

3、解密ZooKeeper的神秘面纱：ZooKeeper的内部实现一直以来都是分布式领域的热门话题。通过源码分析，我们将揭示它的神秘面纱，理解它是如何实现高可用性、一致性和可靠性的。

从客户端发送报文开始

java 复制代码

public static void main(String[] args) throws IOException, InterruptedException, KeeperException {
     //1. 创建一个Zookeeper客户端
     ZooKeeper zookeeper = new ZooKeeper("localhost:2181", 2000, null);
     //2. 创建一个持久节点
     zookeeper.create("/hello", "编程易行".getBytes(StandardCharsets.UTF_8), ZooDefs.Ids.OPEN_ACL_UNSAFE, CreateMode.PERSISTENT);
     Stat stat = new Stat();
     //3. 获取写入节点的数据
     byte[] data = zookeeper.getData("/hello", false, stat);
     System.out.println(new String(data, StandardCharsets.UTF_8));
}

上面是一个非常简单的hello world，就是创建一个Zookeeper客户端，调用create创建节点。然后，在调用getData打印我们之前写入的数据。

我们源码分析就从这里开始。（zookeeper的配置管理，也是个很有意思的话题，后面有机会可以分析下。）

1. 从Zookeeper.create 开始

一切的开始，都是Zookeeper.create

代码非常简洁，其实就是：

1、构造Request报文

2、调用ClientCnxn#submitRequest 发送报文，并等待结果

什么是submit一个报文？

如果是个java，我们想要往一个socket写数据，我们会怎么写？

我们会写 Socket.getOutputStream().write(byte数组)，如果我们用的Netty网络库，我们可能会写Channel.writeAndFlush(对象)

这里zookeeper发送报文的方法，名字叫submit，本身其实也说明了它的原理并不是简单的write 一下就完了。

我们接着往下看

1、先来看类名，叫做 ClientCnxn 这是zookeeper对于客户端连接的一个抽象。Zookeeper客户端与服务端的交互，都是通过ClientCnxn 这一入口。

2、还记得么，在create方法里，我们构造了一个CreateRequest 对象，并且把这个对象以参数形式，传入 submitRequest 方法中。在submitRequest里，我们又把CreateRequest 以参数形式传入queuePacket 方法里

发送报文 = 插入队列？

代码也非常简单

1、把我们的Request 和 Response 包装成一个个的Packet

2、把Packet添加到一个队列里

非常简单，后面的一系列文章中，我们能看到zookeeper的源码设计里，大量的应用了队列。

写入队列中的报文是什么时候发出去的？

客户端调用create肯定不只是想写个队列就完了，终极目标肯定还是要发送数据到服务端。因此，一定会有另一个线程，去读这个队列的数据。这个线程，就是SendThread

1、ClientCnxnSocket的一些初始化

2、如果Tcp连接是断开的

2.1）找到要连接的zookeeper节点地址我们使用zookeeper时，传入的connectString可能不止有一个节点的地址，比如 "10.0.0.1:2181,10.0.0.2:2181,10.0.0.3:2181" 这一步其实就是挑选我们要连接的zookeeper的地址。具体算法其实就是把地址打乱，不停地next。也就是说，如果某台zookeeper节点挂了，下一个循环，会尝试去连另一个zookeeper节点

2.2）发送Connect报文

3、判断是否超时，其实就是一段时间没收到zookeeper的报文就超时了，认为zookeeper已经挂了，这里会抛异常

4、调用网络库发送报文这里就是调用网络库，获取outgoingQueue 队首的报文，通过socket发送出去

整个流程有点复杂，可以对照着流程图理解