浅谈常见的分布式ID生成方案

一、UUID

UUID是通用唯一标识码的缩写,其目的是让分布式系统中的所有元素都有唯一的辨识信息,而不需要通过中央控制器来指定唯一标识。

优点:

(1)降低全局节点的压力,使得主键生成速度更快;

(2)生成的主键全局唯一;

(3)跨服务器合并数据方便。

缺点:

(1)UUID占用16个字符,空间占用较多;

(2)不是递增有序的数字,数据写入IO随机性很大,且索引效率下降。

二、数据库主键自增

MySQL数据库设置主键且主键自动增长。

优点:

(1)INT和BIGINT类型占用空间较小;

(2)主键自动增长,IO写入连续性好;

(3)数字类型查询速度优于字符串。

缺点:

(1)并发性能不高,受限于数据库性能;

(2)分库分表,需要改造,复杂;

(3)自增-数据和数据量泄露。

三、Redis自增ID

Redis计数器,原子性自增。

优点: 使用内存,并发性能好 。

缺点:

(1)数据丢失;

(2)自增-数据量泄露。

四、雪花算法

大名鼎鼎的雪花算法,分布式ID的经典解决方案。雪花算法生成的ID组成如下所示:

(1)符号位,占用1位。

(2)时间戳,占用41位,可以支持69年的时间跨度。

(3)机器ID,占用10位。

(4)序列号,占用12位。一毫秒可以生成4095个ID。

优点:

(1)不依赖外部组件;

(2)性能好。

缺点: 时钟回拨。

相关推荐
bigdata-rookie7 小时前
Spark 部署模式
大数据·分布式·spark
蒋士峰DBA修行之路9 小时前
实验二十二 GaussDB分布式场景调优
分布式·gaussdb
青靴12 小时前
轻量级 CI/CD 实战(三):Kafka消费者Docker容器化部署
分布式·docker·kafka
galaxyffang13 小时前
RocketMQ 为什么性能不如 Kafka?
分布式·kafka·rocketmq
sheji341614 小时前
【开题答辩全过程】以 基于Spark的药品库存可视化分析系统为例,包含答辩的问题和答案
大数据·分布式·spark
A尘埃14 小时前
Spark基于内存计算的数据处理
大数据·分布式·spark
渣渣盟15 小时前
Flink分布式文件Sink实战解析
分布式·flink·scala·1024程序员节
一叶飘零_sweeeet15 小时前
从 Kafka 到 RocketMQ:迁移实战全攻略
分布式·kafka·rocketmq
我还可以再学点15 小时前
八股文面试攻略六:分布式和集群
分布式·面试·职场和发展
曾经的三心草17 小时前
RabbitMQ-面试题分析
分布式·rabbitmq