Java 分布式主键策略

背景

随着业务的增长,文章表可能要占用很大的物理存储空间,为了解决该问题,后期使用数据库分片技术。

将一个数据库进行拆分,通过数据库中间件连接。如果数据库中该表选用ID自增策略,则可能产生重复的ID,

此时应该使用分布式ID生成策略来生成ID。

技术选型

方案 优势 劣势
Redis (INCR)生成一个全局连续递增的类型主键 增加了一个外部组件的依赖,Redis不可用,则整个(INCR)生成一个全局连续递增的数字类数据库将无法在插入
UUID 全局唯一,Mysql也有UUID实现 36个字符组成,占用空间大
Snowflake算法 全局唯一,数字类型,存储成本低 机器规模大于1024台无法支持

雪花算法

snowflake是Twitter开源的分布式ID生成算法,结果是一个ong型的ID。

其核心思想是: 使用41bit作为毫秒数,10bit作为机器的ID(5个bit是数据中心,5个bit的机器ID),12bt作为毫秒内的流水号(意味着每个节点在每毫秒可以产生4096个ID),最后还有一个符号位,永远是0

设置雪花算法

实体类上添加注解@TableId(value = "id",type =IdType.ASSIGN_ID )

kotlin 复制代码
@TableId(value = "id",type =IdType.ASSIGN_ID )
private Long id;

此外,还可以指定机房id和机器id

yaml 复制代码
mybatis-plus:
    global-config:
        # 机房id 0-31
        datacenter-id: 1
        # 机器id
        workerId: 1

小结

数据库的索引是由id进行组织的一个b+树,而b+树这种数据结构,本身是一种有序的多叉树,使用自增id可以减少维护b+带来的性能开销;其次自增id通常使用个id类型的自增类型,而uuid是字符串,字符串所占用的内存空间比long大得多;同时在非聚簇索引每一个非叶子节点存储的就是主键,这也就意味着如果使用uuid每一页能存储的数量会变少,层高可能会变高,性能下降。

但是实际上我们的业务并没有特别高的并发量,并不会要求极致的性能,人员成本、开发周期等因素怎么也需要考虑;很多场景快速的当主键,也是不错的选择。

相关推荐
小江的记录本5 小时前
【JVM虚拟机】垃圾回收GC:四种引用类型:强引用、软引用、弱引用、虚引用(附《思维导图》+《面试高频考点清单》)
java·jvm·spring boot·后端·python·spring·面试
小马爱打代码5 小时前
Spring源码 第四篇:Spring 5 源码深度拆解:AOP 全流程核心原理
java·后端·spring
ServBay6 小时前
2026 Mac 本地大模型部署深度解析与混合架构指南
后端·macos·aigc
一拳一个娘娘腔6 小时前
【SRC漏洞挖掘系列】第10期:GraphQL & API 安全 —— 现代 API 的“裸奔”时代
后端·安全·graphql
ZhengEnCi7 小时前
01-如何监听接口调用情况?
java·spring boot·后端
小马爱打代码8 小时前
Spring源码 第九篇:Spring 5 源码深度拆解 - Spring 事件驱动模型
java·后端·spring
ForgeAI码匠9 小时前
ForgeAdmin|Spring Boot 3 后台框架的自动配置设计:少写配置,多做组合
java·spring boot·后端
IT_陈寒9 小时前
为什么 Java 的 Optional 让我调试到深夜?
前端·人工智能·后端
用户8356290780519 小时前
用 Python 实现 Excel 散点图绘制与定制
后端·python
怪兽陪你看日出B10 小时前
一文彻底搞懂本地缓存之王-Caffeine
后端