【分布式】分布式中的时钟

一、物理时钟 vs 逻辑时钟

时钟的存在主要是为了标识事件的发生顺序。

分布式系统不使用物理时钟记录事件,分布式系统中每个节点记录的时间并不一样,即使设置了 NTP 时间同步节点间也存在毫秒级别的偏差

所以需要有另外的方法记录事件顺序关系,这就是逻辑时钟

二、Lamport timestamps

Lamport时间戳是一种逻辑时钟的表示方法。

分布式系统中按是否存在节点交互可分为三类事件,一类发生于节点内部,二是发送事件,三是接收事件

Lamport时间戳的规则是这样的

  • 每个事件对应一个Lamport时间戳,初始值为0
  • 如果事件在节点内发生,时间戳加1
  • 如果事件属于发送事件,时间戳加1并在消息中带上该时间戳
  • 如果事件属于接收事件,时间戳 = Max(本地时间戳,消息中的时间戳) + 1

通过该定义,可以根据Lamport时间戳进行比较,能获得事件的偏序关系

但当两个事件相同时,由定义可以得知,这种情况只可能出现在两个机器上,所以可以事先对机器编号,根据机器的编号能得到两个时间戳相同的事件的顺序。

也就是说,这种情况下的所有事件都有相对顺序,没有同时发生一说。图1中事件B4和事件C3没有因果关系,属于同时发生事件,但Lamport时间戳定义两者有先后顺序。

三、Vector clock

Vector clock是在Lamport时间戳基础上演进的另一种逻辑时钟方法,它通过vector结构不但记录本节点的Lamport时间戳,同时也记录了其他节点的Lamport时间戳。Vector clock的原理与Lamport时间戳类似,使用图例如下:

同时发生:在两个节点上,两个事件的时间戳大小关系不一致,比如图2中节点B上的第4个事件 (A:2,B:4,C:1) 与节点C上的第2个事件 (B:3,C:2) ,分别是B大和C大,则这两个事件就是同时发生的。

相关推荐
躺不平的理查德3 小时前
General Spark Operations(Spark 基础操作)
大数据·分布式·spark
talle20213 小时前
Zeppelin在spark环境导出dataframe
大数据·分布式·spark
渣渣盟3 小时前
大数据开发环境的安装,配置(Hadoop)
大数据·hadoop·分布式
Angindem3 小时前
SpringClound 微服务分布式Nacos学习笔记
分布式·学习·微服务
龙仔72512 小时前
离线安装rabbitmq全流程
分布式·rabbitmq·ruby
〆、风神14 小时前
Spring Boot 整合 Lock4j + Redisson 实现分布式锁实战
spring boot·分布式·后端
胡萝卜糊了Ohh15 小时前
kafka
分布式·kafka
桑榆080617 小时前
Spark-Streaming核心编程
大数据·分布式·spark
nbsaas-boot19 小时前
分布式微服务架构,数据库连接池设计策略
分布式·微服务·架构