zookeeper如何保证数据强一致性的?

原子广播特性用来保证zookeeper集群数据强一致性的机制。

数据的强一致性是当一个外部客户端去请求一个分布式系统中的数据时一旦这个数据允许被查询,那么我们在任何一个被要求存储该数据的分布式节点上在任何时候都能够查到这份数据且数据内容要求一摸一样。

原子广播中原子就是精确一次性的意思,zookeeper是如何做到数据精确一次性的呢?他是利用了事务的两阶段提交特性;第一个阶段,集群大哥也就是leader收到数据的写入请求之后会把这份数据发送给所有的小弟也即是follower,然后等待小弟们的收到反馈,当大哥收到超过一半的小弟已经回复了,就会宣布第一阶段完成;第一阶段也叫proposal阶段。然后大哥就进入事务的第二阶段,开始告诉小弟既然大部分人都收到了数据,那咱就提交吧,各个小弟把收到的暂时只是放在内存中的数据给同步一份到磁盘中,这个阶段就叫commit。

如果中间出现意外或者超时情况,那么这次数据写入操作就会作废,也就是回滚;比如这个写入数据虽然可能因为网络延迟等原因,导致写入的各个小弟节点的时间不一致,但他可以保证只有在所有小弟将这份数据写入成功之后才对客户端可见,或者如果因为这个小弟的其他故障无法同步到这份数据那么集群在得知这个消息的时候就不把这个查询请求发送到这台机器上,这样一来就保证了整个zookeeper集群的数据强一致性,所以对外部客户端来说zookeeper就是一个能够提供读写强一致性的分布式系统。

相关推荐
阿里云云原生3 小时前
为什么 RAG 落地难?解析数据处理 “三重困境”,事件驱动架构如何破局?
云原生
bigdata-rookie4 小时前
Spark 部署模式
大数据·分布式·spark
努力发光的程序员4 小时前
互联网大厂Java面试:从Spring Boot到大数据处理的实战场景问题解析
spring boot·微服务·云原生·java面试·大数据处理·技术解析·互联网求职
蒋士峰DBA修行之路5 小时前
实验二十二 GaussDB分布式场景调优
分布式·gaussdb
热爱学习的小怪兽7 小时前
Docker环境搭建--在ubuntu安装Docker
云原生·eureka
也许是_8 小时前
架构的取舍之道:在微服务的“混乱”中建立秩序
微服务·云原生·架构
青靴9 小时前
轻量级 CI/CD 实战(三):Kafka消费者Docker容器化部署
分布式·docker·kafka
galaxyffang9 小时前
RocketMQ 为什么性能不如 Kafka?
分布式·kafka·rocketmq
sheji341610 小时前
【开题答辩全过程】以 基于Spark的药品库存可视化分析系统为例,包含答辩的问题和答案
大数据·分布式·spark
A尘埃10 小时前
Spark基于内存计算的数据处理
大数据·分布式·spark