zookeeper如何保证数据强一致性的?

原子广播特性用来保证zookeeper集群数据强一致性的机制。

数据的强一致性是当一个外部客户端去请求一个分布式系统中的数据时一旦这个数据允许被查询,那么我们在任何一个被要求存储该数据的分布式节点上在任何时候都能够查到这份数据且数据内容要求一摸一样。

原子广播中原子就是精确一次性的意思,zookeeper是如何做到数据精确一次性的呢?他是利用了事务的两阶段提交特性;第一个阶段,集群大哥也就是leader收到数据的写入请求之后会把这份数据发送给所有的小弟也即是follower,然后等待小弟们的收到反馈,当大哥收到超过一半的小弟已经回复了,就会宣布第一阶段完成;第一阶段也叫proposal阶段。然后大哥就进入事务的第二阶段,开始告诉小弟既然大部分人都收到了数据,那咱就提交吧,各个小弟把收到的暂时只是放在内存中的数据给同步一份到磁盘中,这个阶段就叫commit。

如果中间出现意外或者超时情况,那么这次数据写入操作就会作废,也就是回滚;比如这个写入数据虽然可能因为网络延迟等原因,导致写入的各个小弟节点的时间不一致,但他可以保证只有在所有小弟将这份数据写入成功之后才对客户端可见,或者如果因为这个小弟的其他故障无法同步到这份数据那么集群在得知这个消息的时候就不把这个查询请求发送到这台机器上,这样一来就保证了整个zookeeper集群的数据强一致性,所以对外部客户端来说zookeeper就是一个能够提供读写强一致性的分布式系统。

相关推荐
脑子加油站2 小时前
k8s-持久化存储
云原生·容器·kubernetes·k8s-持久化存储
zhojiew7 小时前
独立Kubelet静态Pod实践使用ECR Credential Provider拉取镜像的实践
云原生·kubelet
霑潇雨7 小时前
Spark学习基础转换算子案例(单词计数(WordCount))
java·大数据·分布式·学习·spark·maven
富士康质检员张全蛋8 小时前
Kafka架构 数据发送保障
分布式·架构·kafka
zhojiew9 小时前
使用 Spark Connect 在 Amazon EMR on EC2 上实现远程 Spark开发
大数据·分布式·spark
容器魔方9 小时前
华为云 AgentArts 智能体评估, 驱动智能体自优化
云原生·容器·开源·华为云·云计算
庞轩px10 小时前
第二篇:RocketMQ事务消息——分布式事务的最终一致性方案
分布式·rocketmq
星辰_mya10 小时前
码头调度主任——Kubernetes
后端·云原生·容器·面试·kubernetes
momom11 小时前
分布式缓存集群高可用架构与一致性哈希优化实践
分布式·后端·架构
眷蓝天11 小时前
Kubernetes 优先级与调度管理
云原生·容器·kubernetes