“凭什么说你比我先?”——没有上帝时钟,如何判断“谁先谁后”?

物理时钟在分布式系统中难以完美同步,导致无法仅凭物理时间戳来精确判断事件的因果顺序。逻辑时钟为此而生。

兰伯特逻辑时钟

兰伯特逻辑时钟(Lamport Logical Clock)为系统中的每个事件分配一个单调递增的数字(时间戳),用于捕捉事件间的偏序关系(Happened-Before Relationship)。

假设每个进程 Pi 维护一个本地计数器Ci 。

1)进程内事件发生:Pi 在执行一个内部事件或发送消息前,Ci = Ci +1。

2)消息发送:Pi 发送消息m时,附带当前Ci 值作为消息时间戳 ts(m)。

3)消息接收:Pj 接收到消息m后,更新其本地计数器 Cj = max(Cj, ts(m) )+ 1。

如果事件A发生在事件B之前(A -> B),则 C(A) < C(B)。但反之不成立,即 C(A) < C(B)并不一定意味着 A -> B,A和B可能是并发的。

兰伯特时钟虽然解决了存在依赖关系的事件时序,但无法区分两个具有相同逻辑时间戳的事件的真实顺序,也无法判断两个时间戳不同但无因果关系的事件是否为并发。

向量时钟

向量时钟(Vector clock)是逻辑时钟的一种扩展,能够更精确地捕捉事件间的因果关系,并能识别并发事件。

假设有事件A、B分别在节点p、q上发生,向量时钟分别为T[A]、T[B]。

如果Tq[B] > Tq[A]并且Tp[B] >= Tp[A],则A发生于 B之前,记作A -> B,此时说明事件A、B有因果关系。

如果Tq[B] > Tq[A]并且Tp[B] < Tp[A],则认为A、B同时发生,记作A <-> B,此时说明事件A、B不存在因果关系。

例如下图节点B上的第4个事件(A=2 B =4 C=1)与节点C上的第2个事件 (B=3 C=2)没有因果关系,在逻辑上判定为同时发生事件。

而C节点第1个事件(C=1)与B节点第1个事件(B=1 C=1)有因果关系,所以C节点第1个事件 (C=1) 先于B节点第1个事件 (B=1 C=1)发生,后者依赖前者,有先后关系。

版本向量

向量时钟最常见的应用是发现数据冲突(Detect conflict)。分布式系统中数据一般存在多个副本,多个副本可能被同时更新,这会引起副本间数据不一致,版本向量(Version vector)的实现与向量时钟非常类似,目的用于发现数据冲突。

版本向量用一个[counter nodes]对表示。其中,nodes表示节点,counter是一个计数器,初始为0,每次更新操作加1。

假设在一个"去中心化"的分布式系统中,有副本数N=3,R=2,W=2,初始3个副本(A B C)上的数据为(1 1 1),版本向量都为空([ ] [ ] [ ])。

1)首先,某次更新操作由节点A主导,执行+1操作,节点A更新自己及节点C成功。此时三个节点上的副本数据为(2 1 2),版本向量为([(1, A)] [ ] [(1, A)]),A、C的版本向量表示数据版本号为1,更新由节点A主导。

2)接着,更新操作由节点B主导,执行+2 操作,节点B更新自己及节点C成功。此时三个节点上的副本数据分别为(2 3 3),版本向量为([(1, A)] [(1, B)] [(1, B)])。

3)接着,更新操作再由节点A主导,执行+3操作,节点A更新自己及节点C成功。此时三个节点上的数据为(5 3 5),版本向量为([(2, A) (1, A)] [(1, B)] [(2, A) (1, A)])。

4)最后,假设用户读取节点A及节点B上的数据,得到两个不一致的数据5与 3,及这两个数据的版本信息[(2, A) (1, A)] [(1, B)]。假设用户判断出,其实这些加法操作可以合并,那么最终的数据应该是7,另外用户也可以选择保留一个数据例如5作为自己的数据。

由于提供了版本向量信息,不一致的数据其实成为了多版本数据,用户可以通过自定义策略选择合并这些多版本数据。最常见的冲突解决方法有两种:一种是通过客户端逻辑来解决,比如购物车应用;另外一种常见的策略"Last write win",即选择时间戳最新的副本。

未完待续

很高兴与你相遇!如果你喜欢本文内容,记得关注哦!!!

相关推荐
poemyang4 天前
海量数据如何“安家”?一文读懂哈希、范围和一致性哈希三大分片策略
分布式系统
poemyang7 天前
“卧槽,系统又崩了!”——别慌,这也许是你看过最通俗易懂的分布式入门
分布式系统·拜占庭问题
在未来等你1 个月前
RabbitMQ面试精讲 Day 11:RabbitMQ集群架构与节点类型
消息队列·rabbitmq·面试题·高可用·分布式系统·集群架构·节点类型
在未来等你1 个月前
RabbitMQ面试精讲 Day 8:死信队列与延迟队列实现
消息队列·rabbitmq·死信队列·延迟队列·分布式系统·面试技巧
在未来等你1 个月前
RabbitMQ面试精讲 Day 10:消息追踪与幂等性保证
消息队列·rabbitmq·幂等性·分布式系统·面试技巧·消息追踪
在未来等你1 个月前
RabbitMQ面试精讲 Day 6:消息确认与事务机制
消息队列·rabbitmq·面试题·事务机制·分布式系统·消息确认
卷心菜不卷Iris1 个月前
第4章唯一ID生成器——4.5 美团点评开源方案Leaf
雪花算法·美团·分布式系统·leaf·分布式唯一id·点评
夜影风2 个月前
分布式系统中的缓存设计与应用
缓存·系统架构·分布式系统
seventeennnnn2 个月前
谢飞机的Java高级开发面试:从Spring Boot到分布式架构的蜕变之旅
spring boot·微服务架构·java面试·分布式系统·电商支付