高并发系统-分布式唯一ID生成(六)-美团Leaf

紧接着上文高并发系统-分布式唯一ID生成(五)-百度UidGenerator

2. 生成方案

2.8 美团-Leaf

来自于美团开源。

There are no two identical leaves in the world > "世界上没有两片相同的树叶"

Leaf提供两种模式:Leaf-segment和Leaf-snowflake

2.8.1 Leaf-segment(号段模式)

美团的号段模式和之前实现高并发系统-分布式唯一ID生成(二)-号段模式及应用原理基本一致,利用数据库特性,并且做了客户端缓存优化。 主要改变如下:

  • 数据库自增主键方式每次获取ID都得读写一次数据库,造成数据库压力大。改为利用proxy server批量获取,每次获取一个segment(step决定大小)号段的值。用完之后再去数据库获取新的号段,可以大大的减轻数据库的压力。
  • 各个业务不同的发号需求用biz_tag字段来区分,每个biz-tag的ID获取相互隔离,互不影响。如果以后有性能需求需要对数据库扩容,不需要上述描述的复杂的扩容操作,只需要对biz_tag分库分表就行

数据库表设计如下:

sql 复制代码
+-------------+--------------+------+-----+-------------------+-----------------------------+
| Field       | Type         | Null | Key | Default           | Extra                       |
+-------------+--------------+------+-----+-------------------+-----------------------------+
| biz_tag     | varchar(128) | NO   | PRI |                   |                             |
| max_id      | bigint(20)   | NO   |     | 1                 |                             |
| step        | int(11)      | NO   |     | NULL              |                             |
| desc        | varchar(256) | YES  |     | NULL              |                             |
| update_time | timestamp    | NO   |     | CURRENT_TIMESTAMP | on update CURRENT_TIMESTAMP |
+-------------+--------------+------+-----+-------------------+-----------------------------+

重要字段说明:biz_tag用来区分业务,max_id表示该biz_tag目前所被分配的ID号段的最大值,step表示每次分配的号段长度。原来获取ID每次都需要写数据库,现在只需要把step设置得足够大,比如1000。那么只有当1000个号被消耗完了之后才会去重新读写一次数据库。读写数据库的频率从1减小到了1/step

同时针对一次从数据库取一批数据,数据用完后再取数据采用缓存优化。即Leaf服务内部有两个号段缓存区segment。当前号段使用超过xx%,即使用另外线程更新下一个号段

1.优点

  • Leaf服务可以很方便的线性扩展,性能完全能够支撑大多数业务场景。
  • ID号码是趋势递增的8byte的64位数字,满足上述数据库存储的主键要求。
  • 容灾性高:Leaf服务内部有号段缓存,即使DB宕机,短时间内Leaf仍能正常对外提供服务。
  • 可以自定义max_id的大小,非常方便业务从原有的ID方式上迁移过来。

2.缺点

  • ID号码不够随机,能够泄露发号数量的信息,不太安全。
  • TP999数据波动大,当号段使用完之后还是会hang在更新数据库的I/O上,tg999数据会出现偶尔的尖刺。
  • DB宕机会造成整个系统不可用。

2.8.2 Leaf-snowflake 雪花算法模式

Leaf-snowflake方案完全沿用snowflake方案的bit位设计,即是"1+41+10+12"的方式组装ID号。对于workerID的分配,当服务集群数量较小的情况下,完全可以手动配置。Leaf服务规模较大,动手配置成本太高。

所以使用Zookeeper持久顺序节点的特性自动对snowflake节点配置wokerID。

启动顺序如下:

  1. 启动Leaf-snowflake服务,连接Zookeeper,在leaf_forever父节点下检查自己是否已经注册过(是否有该顺序子节点)。
  2. 如果有注册过直接取回自己的workerID(zk顺序节点生成的int类型ID号),启动服务。
  3. 如果没有注册过,就在该父节点下面创建一个持久顺序节点,创建成功后取回顺序号当做自己的workerID号,启动服务。

同时针对雪花算法的时间回拨问题,采用启动后定时上报时间给ZK,同时在启动时判断当前服务时间与ZK对应节点记录时间,如果比ZK时间早,则启动失败告警。(集群部署,一台失败不影响整体)

1. 优点

雪花算法优点,并解决的时间回拨问题

并发很高

2. 缺点

引入ZK,增加系统复杂度

2.8.3. 实践

按照官网方式操作

shell 复制代码
git clone git@github.com:Meituan-Dianping/Leaf.git
//按照上面的号段模式在工程里面配置好
cd leaf
mvn clean install -DskipTests
cd leaf-server

建表

sql 复制代码
mysql> CREATE TABLE `leaf_alloc` (
    ->   `biz_tag` varchar(128)  NOT NULL DEFAULT '',
    ->   `max_id` bigint(20) NOT NULL DEFAULT '1',
    ->   `step` int(11) NOT NULL,
    ->   `description` varchar(256)  DEFAULT NULL,
    ->   `update_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
    ->   PRIMARY KEY (`biz_tag`)
    -> ) ENGINE=InnoDB;
Query OK, 0 rows affected (0.02 sec)

mysql> insert into leaf_alloc(biz_tag, max_id, step, description) values('leaf-segment-test', 1, 2000, 'Test leaf Segment Mode Get Id')
    -> ;
Query OK, 1 row affected (0.02 sec)

mysql>

配置Leaf配置文件

xml 复制代码
leaf.name=com.sankuai.leaf.opensource.test
leaf.segment.enable=true
leaf.jdbc.url=jdbc:mysql://xxx/leaf?autoReconnect=true&characterEncoding=UTF-8&useUnicode=true&connectTimeout=3000&socketTimeout=3000
leaf.jdbc.username=xxx
leaf.jdbc.password=xxx

leaf.snowflake.enable=false
#leaf.snowflake.zk.address=
#leaf.snowflake.port=

运行

arduino 复制代码
mvn spring-boot:run

运行测试

bash 复制代码
curl http://localhost:8080/api/segment/get/leaf-segment-test

参考
Leaf
Leaf------美团点评分布式ID生成系统

相关推荐
luoganttcc23 分钟前
[源码解析] 模型并行分布式训练Megatron (2) --- 整体架构
分布式·架构·大模型
陌上花开࿈1 小时前
调用第三方接口
java
Aileen_0v01 小时前
【玩转OCR | 腾讯云智能结构化OCR在图像增强与发票识别中的应用实践】
android·java·人工智能·云计算·ocr·腾讯云·玩转腾讯云ocr
桂月二二3 小时前
Java与容器化:如何使用Docker和Kubernetes优化Java应用的部署
java·docker·kubernetes
liuxin334455663 小时前
学籍管理系统:实现教育管理现代化
java·开发语言·前端·数据库·安全
海绵波波1073 小时前
flask后端开发(10):问答平台项目结构搭建
后端·python·flask
小马爱打代码4 小时前
设计模式详解(建造者模式)
java·设计模式·建造者模式
栗子~~4 小时前
idea 8年使用整理
java·ide·intellij-idea
2301_801483694 小时前
Maven核心概念
java·maven
网络风云5 小时前
【魅力golang】之-反射
开发语言·后端·golang