浅谈常见的分布式ID生成方案

一、UUID

UUID是通用唯一标识码的缩写,其目的是让分布式系统中的所有元素都有唯一的辨识信息,而不需要通过中央控制器来指定唯一标识。

优点:

(1)降低全局节点的压力,使得主键生成速度更快;

(2)生成的主键全局唯一;

(3)跨服务器合并数据方便。

缺点:

(1)UUID占用16个字符,空间占用较多;

(2)不是递增有序的数字,数据写入IO随机性很大,且索引效率下降。

二、数据库主键自增

MySQL数据库设置主键且主键自动增长。

优点:

(1)INT和BIGINT类型占用空间较小;

(2)主键自动增长,IO写入连续性好;

(3)数字类型查询速度优于字符串。

缺点:

(1)并发性能不高,受限于数据库性能;

(2)分库分表,需要改造,复杂;

(3)自增-数据和数据量泄露。

三、Redis自增ID

Redis计数器,原子性自增。

优点: 使用内存,并发性能好 。

缺点:

(1)数据丢失;

(2)自增-数据量泄露。

四、雪花算法

大名鼎鼎的雪花算法,分布式ID的经典解决方案。雪花算法生成的ID组成如下所示:

(1)符号位,占用1位。

(2)时间戳,占用41位,可以支持69年的时间跨度。

(3)机器ID,占用10位。

(4)序列号,占用12位。一毫秒可以生成4095个ID。

优点:

(1)不依赖外部组件;

(2)性能好。

缺点: 时钟回拨。

相关推荐
CrazyClaz1 小时前
分布式事务专题5
分布式·分布式事务
灯下夜无眠2 小时前
spark集群文件分发问题
大数据·分布式·spark
少许极端3 小时前
Redis入门指南:从零到分布式缓存-string类型
redis·分布式·缓存
Macbethad3 小时前
WPF工业设备诊断管理程序技术方案
大数据·hadoop·分布式
Thomas21434 小时前
pyspark3.5给paimon1.2的表打tag报错 spark_catalog is not a ProcedureCatalog
大数据·分布式·spark
稚辉君.MCA_P8_Java5 小时前
Gemini永久会员 Hadoop分布式计算框架MapReduce
大数据·hadoop·分布式·架构·mapreduce
CrazyClaz5 小时前
分布式事务专题4
分布式·分布式事务
程序员小胖6 小时前
每天一道面试题之架构篇|异步确保型事务——消息队列驱动的分布式事务解决方案
分布式·面试
CrazyClaz6 小时前
分布式事务专题2
分布式·分布式事务
鹿衔`7 小时前
CDH 6.3.2 集群外挂 Spark 3.5.7 (Paimon) 集成 Hue 实战指南
大数据·分布式·spark