mysql 表主键id 自增&雪花

不像程序员的程序媛2026-04-06 15:36

在 MySQL 中，主键 ID 的选择是一个经典问题。自增 ID 和 雪花 ID 的核心区别在于：生成机制 （集中式 vs 分布式）、是否有序 、以及在分库分表场景下的表现。

一核心原理

二详细对比

1. 有序性与索引性能

自增 ID：
- 严格有序。新插入的数据 ID 总是大于之前的数据。
- 索引效率高。InnoDB 引擎的主键是聚簇索引，数据按照主键顺序存储。自增 ID 保证了新数据只往"最后面"写，页分裂（Page Split）发生的概率极低，写入性能非常好。
雪花 ID：
- 趋势递增，但非严格连续。
- 由于高位是时间戳，整体上写入是有序的，不会像 UUID 那样导致随机写入。但在高并发下，同一毫秒内的 ID 顺序取决于序列号。
- 相比自增，对 B+Tree 索引的影响很小（远优于 UUID），但在极端海量写入下，理论上可能比纯自增产生稍多的页分裂。

2. 安全性（防泄露）

自增 ID ：极不安全。
- 在 API 接口中如果暴露了自增 ID（如 /user/1001），竞争对手或恶意用户可以：
  - 通过 ID 差值推算业务量（昨天 1000，今天 2000，就知道新增了 1000 用户）。
  - 通过遍历 ID 爬取所有数据（/user/1001, /user/1002）。
雪花 ID ：较安全。
- ID 通常是 19 位的长整型数字（如 6892001845624832）。
- 由于不是连续的，外界无法通过一个 ID 推测出总数，也无法通过简单加减进行遍历爬取（虽然理论上可以通过时间戳推测大致顺序，但成本高很多）。

3. 分库分表

自增 ID ：痛点。
- 在分库分表（Sharding）场景下，如果每个分表依然使用自己的自增，会导致 全局 ID 重复。
- 解决方案通常依赖设置 auto_increment_offset 和 auto_increment_increment（步长），但运维复杂，扩容困难，或者依赖中间件（如 Sequence 表）生成，这又引入了单点性能瓶颈。
雪花 ID ：最佳拍档。
- 天生就是为了分布式系统设计的。应用层在插入数据前，直接生成一个全局唯一的 ID。
- 分库分表时，无需任何中心化协调，可以直接将雪花 ID 作为逻辑主键写入不同的分表，绝对保证全局唯一。

4. 性能

自增 ID：
- 性能极高。数据库自身维护，无需额外计算。
- 但在高并发下，如果使用 REPLACE INTO 或者某些特殊锁模式下，AUTO_INCREMENT 锁可能会有轻微竞争（不过 MySQL 8.0+ 已优化为轻量级锁）。
雪花 ID：
- 性能极高 。在应用内存中生成，不依赖数据库网络 IO，没有锁竞争。
- 缺点是依赖系统时钟。如果系统时钟回拨（NTP 校准），可能导致 ID 重复或产生异常（虽然成熟的算法如百度 UidGenerator、美团 Leaf 都解决了时钟回拨问题）

三如何选择

上一篇：ubuntu 22.04环境中安装goland

下一篇：解决OpenCV人脸检测报错：(-215:Assertion failed) !empty() 保姆级教程

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03如何新建文件夹？电脑新建文件夹的4种方法 04AI科技热点日报 | 2026年07月01日 05幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 082026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？092026 年 AI 大模型 & AI 编程工具实战全总结 10微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新