秒杀 : 来学一学大厂里面常见的分布式ID方案

👈👈👈 欢迎点赞收藏关注哟

首先分享之前的所有文章 >>>> 😜😜😜
文章合集 : 🎁 juejin.cn/post/694164...
Github : 👉 github.com/black-ant
CASE 备份 : 👉 gitee.com/antblack/ca...

一. 前言

上一篇梳理了 分布式ID的设计精华 , 这一篇作为上一篇的补充,来看一看一般的大型系统里面有哪些常见的分布式ID方案。

二. 宏观方向

按照上文我们了解的 ,业界常用的几种分布式ID方案主要是那么几种 :

  • 基于雪花算法 :通常基于雪花 + 自身的系统特性来进行一定的改造
  • 基于分布式锁 + 号段 + 雪花算法 : 美团的 Leaf 就是采用这种方式 ,会更适用于并发高的场景
  • 基于数据库的分布式ID : 不同于老一代的数据库,现在很多新一代分布式数据库都带有ID生成的功能

除了以上这几种常见的方式 , 还有一些不太常见或者存在一定缺陷的分布式ID方式 :

  • UUID长度较长 ,性能较差 , 并没有实现系统间的可见和通信,所以还是存在重复的可能
  • 基于组件的分布式ID : 基于外部组件来实现 通信 / 上锁 / 数据生成
    • 常见的包括 Redis , 或者 MongoDB 本身的 ObjectId 生成方式
    • 问题在于并发不高 ,而且代码可能会很复杂,需要控制锁的粒度

三. 浅学一下大厂的实现方案

3.1 雪花 : 美团 Leaf-snowflake @ Leaf------美团点评分布式ID生成系统

  • Leaf-snowflake :
    • 即常规的雪花算法,但是在雪花的基础上做了一些变动
      1. 通过 Zookeeper 来配置 WorkerId ,最大的特性在于WorkerID 的可重用
      1. 本机系统上缓存 WorkerID 文件
      1. 启动时会校验时钟时间,时钟要大于之前机器时间(会和其他的机器时间做对比)

具体实现可以参考 : 分布式ID的设计精华

3.2 雪花 : 百度的 uid-generator


  • ID 格式 :
    • sign(1bit) : 固定1bit符号标识,即生成的UID为正数
    • delta seconds (28 bits) : 当前时间,相对于时间基点"2016-05-20"的增量值
      • 时间不依赖于系统时间,而是基于 AtomicLong 进行自增
      • 带来的后果就是时间可能会和实际时间偏移
      • 存在借用未来时间的现象
    • worker id (22 bits) : 机器id,最多可支持约420w次机器启动
      • 每次启动时初始化,数据库自增实现
      • 可以自定义 WorkerId 位数和初始化策略 (这样的话就可以适配不同的集群范围)
    • sequence (13 bits) :每秒下的并发序列,13 bits可支持每秒8192个并发
      • RingBuffer 的使用,不实时计算并发ID,预生成多个分布式ID进行保存
  • 总结
    • 可以看到 , 百度认为机器ID的位数需要得更多,可能是由于服务器多,启动比较频繁导致
    • 对于单机而言 ,每秒每条业务线 8000 并发已经很高了

  • 精华 : sequence ID 的生成
    • 一般简单的实现方式是通过加锁 synchronized 或者通过原子变量实现一个单机的自增
    • 百度采用了 RingBuffer 的形式 ,来实现 sequence 的生成
      • 总结一下 ,在我看来主要是 : 预生成 + 预占 + 消费

百度的精髓在于 RingBuffer 实现的环形数组,实现了并发位ID的生产消费关系,在这个数组中存在两个指针 :

  • Tail指针 : 当前生产的 ID 序列号
  • Cursor 指针 : 当前消费的 ID 序列号

CachedUidGenerator采用了双RingBuffer,Uid-RingBuffer用于存储UidFlag-RingBuffer用于存储Uid状态(是否可填充、是否可消费)

由于RingBuffer是一个环形,所以要保证生产不能超过消费(PutRejectPolicy策略),还要避免消费追上了生产 (TakeRejectPolicy)

同时百度案例里面也提到了伪共享的问题,在 RingBuffer 中连续分配的数组可以通过 CPU Cache 最大程度的提升性能。 但是由于多个线程对同一缓存行竞争,会带来缓存行的失效和写前的缓存行校验,就带来了额外的性能损耗。

❓ 问题一 : 伪共享是什么意思 ?

不同核心(或处理器)共享同一缓存行而导致的性能问题 。

当多个核心同时修改或读取同一缓存行中的不同数据时,由于缓存的一致性协议,这个缓存行会被加载到多个核心的缓存中。

所以当多线程处理不相干的变量时会相互影响 , 造成伪共享拖慢速度。 (缓存竞争 / 无效化等)

❓ 问题二 :怎么解决伪共享 ?

  • 核心点 : CPU 是以缓存行的形式进行读取的
  • 基于这个概念 ,比较常见的解决方式是通过特殊的结构,或者通过填充缓存行的方式 ,确保不同的数据项被存储在不同的缓存行中,从而避免不必要的缓存行竞争

❓ 问题三:百度 UID Generator 具体解决思路 ?

  • RingBuffer填充时机
    • 程序启动时,将RingBuffer填充满,缓存着8192个id
    • 在调用getUID()获取id时,检测到RingBuffer中的剩余id个数小于总个数的50%,将RingBuffer填充满,使其缓存8192个id
    • 定时填充
  • CacheLine补齐 : 通过 缓存行填充 , 避免tail和cursor落到同一个缓存行上
java 复制代码
/** Tail: last position sequence to produce */
private final AtomicLong tail = new PaddedAtomicLong(START_POINT);

/** Cursor: current position sequence to consume */
private final AtomicLong cursor = new PaddedAtomicLong(START_POINT)

// 内部逻辑 : 
- PaddedAtomicLong 中会自动进行一个 48 bytes 的填充
- CPU缓存行通常为64字节 , 64字节=8字节(对象引用)+6*8字节(长填充)+8字节(长值)

❓ 问题四:借用未来时间?? ?

简单点说 ,就是由于每秒只有 8192 个空位 ,所以当超过这个空位的时候 ,会借用 delta seconds 未来的位置,也就是借用未来时间。

也就是使用了未来的时间来生成id,【最多】可支持约8.7年

3.3 号段 :美团 Leaf-segment @ Leaf------美团点评分布式ID生成系统

  • Leaf-segment :
    • 这种方案的核心在于每次从DB中拿取一个号段,那么锁的竞争主要在拿号段的过程中
    • 为了解决这种问题,美团采用第一个号段使用百分之10的时候就提前拿后面一个号段
    • 缺点在于号段是可以推导和预测的,比如预测销量。
      • 所以很多现实里面会进行跳段,跳过多个数到下一个数。

3.4 号段 :滴滴 Tinyid

  • Tinyid扩展了leaf-segment算法,支持了多db(master),同时提供了java-client(sdk)使id生成本地化,获得了更好的性能与可用性
  • 整体思路也很有意思 ,感兴趣的可以看下官方文档

总结和思考

分布式ID方案真的不难,业界常用的就是这些。

这些概念点也基本上写烂了,但是执意发出来的原因是想看过这些之后得出一些自己的理解。

想法心得 :

雪花算法 是 鼻祖 ,其他的算法或多或少在这个基础上进行了改造。充分说明了这个方案的优秀。

几大厂商里面 ,使用难度方面 美团和百度的都比较简单 ,引入 SDK 通常就能实现 ,最多需要部署时间服务器,上手难度较低。 滴滴的方案需要部署多套服务器 ,还要引入 client 消费 ,依赖性比较强了。

技术深度最深的应该是 百度的 uid-generator , 设计的思路感悟很多。 滴滴的 Tinyid 走出了另外一条路线,没有局限于雪花的思路。

阶段总结 :

👉 大多数情况下 ,都会采用雪花变种来进行分布式ID的生成, 这种算法其实很简单,并且具有极佳的性能。哪怕复杂的异常场景下 ,只需要做好时间同步,就不需要担心出现大的纰漏。

而且基于各自业务的定制,也可以适配一些复杂的场景,当为第一选择。

👉 其次一些场景 , 可以考虑 分布式锁 + 号段的形式。 这种思想既可以和雪花算法组合 ,也可以任意组合其他的 ID 算法。 其 根本思路在于 : 先上锁 , 然后通过ID分发器(Redis / Server 等很多种方式)拿一批 ID 在本地使用。

这种方案适用于突发性的并发极高的场景 ,比单纯的分布式锁获取性能要更高。 首先在大范围上保证 ID 段唯一 ,然后在本地上进行单线程分发即可。

👉 如果选用的是分布式数据库 , 例如 OceanBase 这种 ,可以考虑使用其本身的自增列的特性。 在使用 MySQL 的时候 ,我们通常对于大数据量是采用分库分表的方式, 其无法很好的实现不同库之间的控制,自增也只能做到单表 。

但是一些分布式数据库则可以很好的解决这种问题,正常不同的分片之间也做到 ID 唯一。

相关推荐
方圆想当图灵5 分钟前
缓存之美:万文详解 Caffeine 实现原理(下)
java·redis·缓存
栗豆包20 分钟前
w175基于springboot的图书管理系统的设计与实现
java·spring boot·后端·spring·tomcat
等一场春雨1 小时前
Java设计模式 十四 行为型模式 (Behavioral Patterns)
java·开发语言·设计模式
Again_acme1 小时前
20250118面试鸭特训营第26天
服务器·面试·php
萧若岚1 小时前
Elixir语言的Web开发
开发语言·后端·golang
Channing Lewis1 小时前
flask实现重启后需要重新输入用户名而避免浏览器使用之前已经记录的用户名
后端·python·flask
Channing Lewis1 小时前
如何在 Flask 中实现用户认证?
后端·python·flask
酱学编程2 小时前
java中的单元测试的使用以及原理
java·单元测试·log4j
我的运维人生2 小时前
Java并发编程深度解析:从理论到实践
java·开发语言·python·运维开发·技术共享
一只爱吃“兔子”的“胡萝卜”2 小时前
2.Spring-AOP
java·后端·spring