Java面试28-谈谈常用的分布式ID设计方案

Plus-ultra2024-08-04 8:15

首先，分布式全局ID的解决方案有很多，比如：

使用Mysql的全局表
使用Zookeeper的有序节点
使用MongoDB的objectid
redis的自增id
UUID等等

这些方案只是解决基础的id唯一性问题，在实际生产环境中，需要构建一个全局唯一id还需要考虑更多的因素：

有序性，有序的ID能够更好的确认数据的位置，以及B+树的存储结构中，范围查询的效率更高，并且可以提升B+树数据维护的效率；
安全性，避免恶意爬取数据造成数据泄露；
可用性，ID生成系统的可用性要求非常高，一旦出现故障就会造成业务不可用的问题；
性能，全局ID生成系统需要满足整个公司的业务需求，涉及到亿级别的调用，对性能要求较高。

因此，如果我们选择数据库的全局表，每获取一次id就需要更新数据库，性能上限比较明显，而且基于数据库构建高扩展和高性能的解决方案难度很大。所以，目前市面上主流的解决方案是基于Twitter早期开源的snowflake雪花算法 。它是由64位长度组成的全局id生成算法，通过对64位进行区间划分来表述不同含义实现唯一性 。它的好处是：算法实现简单，不存在太多外部依赖，可以生成有意义的有序编号。基于位运算，性能也很好，Twitter测试的峰值是10万个每秒。

另外，美国公司开源了一个全局唯一id生成系统leaf，它里面也用到了雪花算法去构建全局唯一id，并且在高性能和高可用方面，做了很多优化，为美团内部业务提供了每天上亿次的调用。