谈谈常用的分布式 ID 设计方案

首先,分布式全局 ID 的解决方案有很多,比如:

  • 使用 Mysql 的全局表
  • 使用 Zookeeper 的有序节点
  • 使用 MongoDB 的 objectid
  • redis 的自增 id
  • UUID 等等
  • ......

这些方案只是解决基础的 id 唯一性问题,在实际生产环境中,需要构建一个全局唯一 id 还需要考虑更多的因素:

  • 有序性, 有序的 ID 能够更好地确认数据的位置,

以及 B+数据的存储结构中,范围查询的效率更高,并且可以提升 B+树数据维护的效率。

  • 安全性,避免恶意爬取数据造成数据泄露
  • 可用性,ID 生成系统的可用性要求非常高,一旦出现故障就会造成业务不可用的问题
  • 性能,全局 id 生成系统需要满足整个公司的业务需求,涉及亿级别的调用,对性能要求较高 因此,如果我们选择数据库的全局表,你每获取一次 id 就需要更新数据库,性能上限比较明显, 而且基于数据库构建高扩展和高性能的解决方案难度很大。

所以,目前市面上主流的解决方案是基于 Twitter 早期开源的 Snowflake 雪花算法(图片)。

它是由 64 位长度组成的全局 id 生成算法,通过对 64 位进行区间划分来表述不同含义实现唯一性。

它的好处是:

  • 算法实现简单
  • 不存在太多外部依赖
  • 可以生成有意义的有序编号
  • 基于位运算,性能也很好,Twitter 测试的峰值是 10 万个每秒。

另外,美团公司开源了一个全局唯一 id 生成系统 leaf,它里面也用到了雪花算法去构建全局唯一 id 并且在高性能和高可用方面,做了很多的优化,为美团内部业务提供了每天上亿次的调用。

相关推荐
^辞安8 小时前
RocketMQ为什么自研Nameserver而不用zookeeper?
分布式·zookeeper·rocketmq
在未来等你10 小时前
Kafka面试精讲 Day 8:日志清理与数据保留策略
大数据·分布式·面试·kafka·消息队列
poemyang11 小时前
“你还活着吗?” “我没死,只是网卡了!”——来自分布式世界的“生死契约”
分布式
echoyu.11 小时前
消息队列-初识kafka
java·分布式·后端·spring cloud·中间件·架构·kafka
明达智控技术12 小时前
MR30分布式I/O在面机装备中的应用
分布式·物联网·自动化
JAVA学习通14 小时前
【RabbitMQ】---RabbitMQ 工作流程和 web 界面介绍
分布式·rabbitmq
安卓开发者15 小时前
鸿蒙NEXT应用数据持久化全面解析:从用户首选项到分布式数据库
数据库·分布式·harmonyos
JAVA学习通18 小时前
【RabbitMQ】如何在 Ubuntu 安装 RabbitMQ
分布式·rabbitmq
Lansonli18 小时前
大数据Spark(六十三):RDD-Resilient Distributed Dataset
大数据·分布式·spark
BYSJMG18 小时前
计算机毕业设计选题:基于Spark+Hadoop的健康饮食营养数据分析系统【源码+文档+调试】
大数据·vue.js·hadoop·分布式·spark·django·课程设计