zookeeper如何保证数据强一致性的？

海王星程序猿2024-04-04 11:12

原子广播特性用来保证zookeeper集群数据强一致性的机制。

数据的强一致性是当一个外部客户端去请求一个分布式系统中的数据时一旦这个数据允许被查询，那么我们在任何一个被要求存储该数据的分布式节点上在任何时候都能够查到这份数据且数据内容要求一摸一样。

原子广播中原子就是精确一次性的意思，zookeeper是如何做到数据精确一次性的呢？他是利用了事务的两阶段提交特性；第一个阶段，集群大哥也就是leader收到数据的写入请求之后会把这份数据发送给所有的小弟也即是follower，然后等待小弟们的收到反馈，当大哥收到超过一半的小弟已经回复了，就会宣布第一阶段完成；第一阶段也叫proposal阶段。然后大哥就进入事务的第二阶段，开始告诉小弟既然大部分人都收到了数据，那咱就提交吧，各个小弟把收到的暂时只是放在内存中的数据给同步一份到磁盘中，这个阶段就叫commit。

如果中间出现意外或者超时情况，那么这次数据写入操作就会作废，也就是回滚；比如这个写入数据虽然可能因为网络延迟等原因，导致写入的各个小弟节点的时间不一致，但他可以保证只有在所有小弟将这份数据写入成功之后才对客户端可见，或者如果因为这个小弟的其他故障无法同步到这份数据那么集群在得知这个消息的时候就不把这个查询请求发送到这台机器上，这样一来就保证了整个zookeeper集群的数据强一致性，所以对外部客户端来说zookeeper就是一个能够提供读写强一致性的分布式系统。