mysql 表主键id 自增&雪花

在 MySQL 中,主键 ID 的选择是一个经典问题。自增 ID雪花 ID 的核心区别在于:生成机制 (集中式 vs 分布式)、是否有序 、以及在分库分表场景下的表现。

一 核心原理

二 详细对比

1. 有序性与索引性能
  • 自增 ID

    • 严格有序。新插入的数据 ID 总是大于之前的数据。

    • 索引效率高。InnoDB 引擎的主键是聚簇索引,数据按照主键顺序存储。自增 ID 保证了新数据只往"最后面"写,页分裂(Page Split)发生的概率极低,写入性能非常好。

  • 雪花 ID

    • 趋势递增,但非严格连续。

    • 由于高位是时间戳,整体上写入是有序的,不会像 UUID 那样导致随机写入。但在高并发下,同一毫秒内的 ID 顺序取决于序列号。

    • 相比自增,对 B+Tree 索引的影响很小(远优于 UUID),但在极端海量写入下,理论上可能比纯自增产生稍多的页分裂。

2. 安全性(防泄露)
  • 自增 ID极不安全

    • 在 API 接口中如果暴露了自增 ID(如 /user/1001),竞争对手或恶意用户可以:

      • 通过 ID 差值推算业务量(昨天 1000,今天 2000,就知道新增了 1000 用户)。

      • 通过遍历 ID 爬取所有数据(/user/1001, /user/1002)。

  • 雪花 ID较安全

    • ID 通常是 19 位的长整型数字(如 6892001845624832)。

    • 由于不是连续的,外界无法通过一个 ID 推测出总数,也无法通过简单加减进行遍历爬取(虽然理论上可以通过时间戳推测大致顺序,但成本高很多)。

3. 分库分表
  • 自增 ID痛点

    • 在分库分表(Sharding)场景下,如果每个分表依然使用自己的自增,会导致 全局 ID 重复

    • 解决方案通常依赖设置 auto_increment_offsetauto_increment_increment(步长),但运维复杂,扩容困难,或者依赖中间件(如 Sequence 表)生成,这又引入了单点性能瓶颈。

  • 雪花 ID最佳拍档

    • 天生就是为了分布式系统设计的。应用层在插入数据前,直接生成一个全局唯一的 ID。

    • 分库分表时,无需任何中心化协调,可以直接将雪花 ID 作为逻辑主键写入不同的分表,绝对保证全局唯一。

4. 性能
  • 自增 ID

    • 性能极高。数据库自身维护,无需额外计算。

    • 但在高并发下,如果使用 REPLACE INTO 或者某些特殊锁模式下,AUTO_INCREMENT 锁可能会有轻微竞争(不过 MySQL 8.0+ 已优化为轻量级锁)。

  • 雪花 ID

    • 性能极高 。在应用内存中生成,不依赖数据库网络 IO,没有锁竞争

    • 缺点是依赖系统时钟。如果系统时钟回拨(NTP 校准),可能导致 ID 重复或产生异常(虽然成熟的算法如百度 UidGenerator、美团 Leaf 都解决了时钟回拨问题)

三 如何选择

相关推荐
AgCl231 天前
MYSQL-5-DCL数据查询语言-3/16
数据库·mysql
IvorySQL1 天前
PostgreSQL 技术日报 (4月7日)|内核开发新动态,多项功能优化落地
数据库·postgresql·开源
IvorySQL1 天前
PostgreSQL 技术日报 (4月6日)|内核补丁与性能优化速递
数据库·postgresql·开源
IvorySQL1 天前
PostgreSQL 技术日报 (4月5日)|六大核心补丁进展,生产环境必看
数据库·postgresql·开源
想唱rap1 天前
线程的同步与互斥
linux·运维·服务器·数据库·mysql
IvorySQL1 天前
走进高校,走近开源|IvorySQL 社区即将亮相应急管理大学开源学术报告会
数据库·postgresql·开源
殷紫川1 天前
干掉 90% 慢 SQL!MySQL 全链路排查与优化方法论,从执行计划到表结构全拆解
mysql
splage1 天前
Oracle分页sql
数据库·sql·oracle
殷紫川1 天前
MySQL InnoDB 锁机制全解:行锁 / 表锁 / 间隙锁 / 临键锁底层逻辑与死锁避坑指南
mysql
光泽雨1 天前
mysql 约束
数据库·mysql