常用的分布式 ID 设计方案

梦城忆2025-03-10 17:55

文章目录

1.UUID
[2.数据库自增 ID](#2.数据库自增 ID)
3.雪花算法
[4.Redis 生成 ID](#4.Redis 生成 ID)
[5.美团 Leaf](#5.美团 Leaf)

1.UUID

原理：UUID 是由数字和字母组成的 128 位标识符，通过特定算法随机生成，包括时间戳、计算机网卡地址等信息。常见的版本有版本 1（基于时间戳和 MAC 地址）、版本 4（纯随机数）等。

优点：

生成简单，本地生成，不需要依赖额外的组件或服务，能有效减少网络开销。
全球唯一，基本能保证在任何场景下不会重复。

缺点：

长度较长，通常为 36 个字符（如550e8400-e29b-41d4-a716-446655440000），占用存储空间大，在数据库存储和传输时会增加开销。
无序性，导致在数据库索引中效率较低，不利于排序和分页操作。

2.数据库自增 ID

原理：利用关系型数据库（如 MySQL）的自增字段特性，每插入一条数据，ID 自动递增。可以单库单表生成，也可以分库分表生成（如设置不同的初始值和步长）。

优点：

简单直观，符合人们对 ID 的认知习惯，容易理解和使用。
有序性，方便进行排序、分页和统计等操作。

缺点：

性能瓶颈，在高并发场景下，数据库的写操作会成为性能瓶颈，因为自增 ID 的生成依赖数据库的锁机制。
扩展性差，分库分表时，ID 的生成和管理会变得复杂，需要额外的逻辑来保证唯一性。

3.雪花算法

原理：由 Twitter 开源，是一种生成 64 位整数 ID 的算法。它将 64 位划分为不同部分，包含 1 位符号位（固定为 0）、41 位时间戳（毫秒级）、10 位工作机器 ID（可支持 1024 个节点）和 12 位序列号（同一毫秒内生成不同 ID）。

优点：

高性能，在内存中生成，不依赖数据库等外部组件，生成速度快，能满足高并发场景。
有序性，根据时间戳生成，基本保证 ID 是有序的，有利于数据库索引和排序。
可扩展性，通过调整工作机器 ID 位数，可以适应不同规模的分布式系统。

缺点：

强依赖时钟，若服务器时钟回拨，可能会生成重复 ID，需要额外的处理逻辑。
实现相对复杂，需要对算法原理有一定了解才能正确实现和维护。

4.Redis 生成 ID

原理：利用 Redis 的INCR或INCRBY命令，以原子操作的方式递增一个键的值，以此作为 ID。也可以结合时间戳等信息生成更有意义的 ID。

优点：

性能高，Redis 基于内存操作，处理速度快，能应对高并发的 ID 生成需求。
可扩展性好，Redis 本身支持集群部署，可以方便地扩展以满足更大规模的系统需求。

缺点：

依赖外部组件，若 Redis 出现故障，会影响 ID 的生成。
没有内置的时间顺序性，如果需要有序 ID，需要额外处理。

5.美团 Leaf

原理：美团开源的分布式 ID 生成系统，支持两种模式。一是 "雪花算法" 模式，适用于强依赖 ID 有序性的场景；二是 "segment（号段）" 模式，服务端一次性分配一个号段给客户端，客户端在号段内自行生成 ID，用完后再向服务端申请新号段。

优点：

灵活性高，可根据不同业务场景选择不同模式，满足多样化的需求。
高性能，"segment" 模式下，客户端在本地生成 ID，减少了与服务端的交互，提高了性能。

缺点：

实现相对复杂，需要搭建和维护 Leaf 服务。
在 "segment" 模式下，如果号段设置不合理，可能会导致号段浪费或不足的情况。

上一篇：内存泄漏出现的时机和原因，如何避免？

下一篇：2025国内网络反爬新高度：代理IP智能轮换算法揭秘

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05AI科技热点日报 | 2026年07月01日 06幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 07微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 08AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 092026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？10【解构】DeepSeek V4 发布：技术报告深度解读 + 横向对比六大开源模型，我们的判断是……