首先,分布式全局ID的解决方案有很多,比如:
- 使用Mysql的全局表
- 使用Zookeeper的有序节点
- 使用MongoDB的objectid
- redis的自增id
- UUID等等
这些方案只是解决基础的id唯一性问题,在实际生产环境中,需要构建一个全局唯一id还需要考虑更多的因素:
- 有序性,有序的ID能够更好的确认数据的位置,以及B+树的存储结构中,范围查询的效率更高,并且可以提升B+树数据维护的效率;
- 安全性,避免恶意爬取数据造成数据泄露;
- 可用性,ID生成系统的可用性要求非常高,一旦出现故障就会造成业务不可用的问题;
- 性能,全局ID生成系统需要满足整个公司的业务需求,涉及到亿级别的调用,对性能要求较高。
因此,如果我们选择数据库的全局表,每获取一次id就需要更新数据库,性能上限比较明显,而且基于数据库构建高扩展和高性能的解决方案难度很大。所以,目前市面上主流的解决方案是基于Twitter早期开源的snowflake雪花算法 。它是由64位长度组成的全局id生成算法,通过对64位进行区间划分来表述不同含义实现唯一性 。它的好处是:算法实现简单,不存在太多外部依赖,可以生成有意义的有序编号。基于位运算,性能也很好,Twitter测试的峰值是10万个每秒。
另外,美国公司开源了一个全局唯一id生成系统leaf,它里面也用到了雪花算法去构建全局唯一id,并且在高性能和高可用方面,做了很多优化,为美团内部业务提供了每天上亿次的调用。