手写基于redis-lua脚本实现分布式id生成器starter

手写基于redis-lua脚本实现分布式id生成器starter

文章目录

1.前言

由于之前分享过一篇:百度开源分布式id生成器集成--真香警告

https://mp.weixin.qq.com/s/FDIEcLcpcaRzjDWTHiMWrg

里面提到了基于redis来实现一个分布式id生成器的思路,只是简单的说了下,本次分享就手写了一个。

2.实现思路

本文只讲思路,至于源码就不做过多的讲解,也很简单,可以拉下来看一看是如何实现的。

2.1lua脚本的特性

利用redis执行lua脚本是原子的,这个是核心,至于lua脚本的写法千变万化。

2.2 了解三个redis命令

首先,要知道redis的EVAL,EVALSHA、TIME命令:

http://redis.io/commands/eval
http://redis.io/commands/evalsha
http://redis.io/commands/time

2.3集群自增序列实现原理

假定集群里有3个节点,则节点1返回的seq是:

0, 3, 6, 9, 12 ...

节点2返回的seq是

1, 4, 7, 10, 13 ...

节点3返回的seq是

2, 5, 8, 11, 14 ...

这样每个节点返回的数据都是唯一的。

2.4三种实现思路

tag:是一个applicationName + ":" + tabName这个对应哪个业务应用的哪张表,tag是一个标记隔离各个业务表的id生成key,本文基于redis-lua脚本实现的分布式id生成器starter的实现固定redis是1-3个节点,大于三节点需要去改源码和lua脚本,所以配置只能配置1-3个redis节点信息,超过三个不支持。最大位数19位,该限制是由于mysq的bigInt的最大位数是19位,可以拓展为其它存储的主键类型的最大位支持。

2.4.1 实现思路一

前缀格式有三种,后缀都是一个自增序列:

YY + 三位天(该年第几天) +一个自增序列

YYYY + 三位天(该年第几天) +一个自增序列

YYYYMMDD + 一个自增序列

位数:8-19位

格式一:24114000000000128

格式二:20241140000000135

格式三:20240423000000003

生成的id自增长度取决于19位-去前缀格式位的长度,可以满足每日id生成亿级别的id,可以满足大多数的业务id生成场景使用。

2.4.2 实现思路二

一个自增序列

位数不限,也就是可以无限生成id

2.4.3实现思路三

7188371276761663493

利用redis的lua脚本执行功能,在每个节点上通过lua脚本生成唯一ID。 生成的ID是64位的:

  • 使用41 bit来存放时间,精确到毫秒,可以使用41年。
  • 使用12 bit来存放逻辑分片ID,最大分片ID是4095
  • 使用10 bit来存放自增长ID,意味着每个节点,每毫秒最多可以生成1024个ID

比如GTM时间 Fri Mar 13 10:00:00 CST 2015 ,它的距1970年的毫秒数是 1426212000000,假定分片ID是53,自增长序列是4,则生成的ID是:

5981966696448054276 = 1426212000000 << 22 + 53 << 10 + 4

redis提供了TIME命令:

http://redis.io/commands/time

可以取得redis服务器上的秒数和微秒数。因为lua脚本返回的是一个四元组。

second, microSecond, partition, seq

客户端要自己处理,生成最终ID。

((second * 1000 + microSecond / 1000) << (12 + 10)) + (shardId << 10) + seq;

本实现分片设置是选取的节点个数0-3,也可以自己去拓展只要在最大分片ID是4095内即可,可以修改为取代码中自增的index的值,该实现生成的id可以反解id信息。

3.项目工程目录

有兴趣的可以拉代码下来扒一扒,瞧一瞧看一看。

4.源码仓库地址

https://gitee.com/BigBigFeiFei/redis-distributed-id-generator-start
https://github.com/BigBigFeiFei/redis-distributed-id-generator-start

5.依赖及使用配置

5.1依赖

项目中引入如下一个依赖即可:

xml 复制代码
<dependency>
    <groupId>io.github.bigbigfeifei</groupId>
    <artifactId>redis-distributed-id-generator-start</artifactId>
    <version>1.0</version>
</dependency>
或
<dependency>
    <groupId>io.gitee.bigbigfeifei</groupId>
    <artifactId>redis-distributed-id-generator-start</artifactId>
    <version>1.0</version>
</dependency>

5.2nacos配置

yaml 复制代码
## 配置需要保证唯一不重复(eqps中的每一的index唯一,一般配置成递增的,队列交换机绑定关系的bean注入都是根据rps的List下标+eqps中index下标注入保证了唯一性)
zlf-redis-id-generator:
  redis:
    rps:
      - redis-host: xxxx1
        redis-port: 6379
        redis-pass: 12345678
      - redis-host: xxxx2
        redis-port: 6379
        redis-pass: 12345678
      - redis-host: xxxx3
        redis-port: 6379
        redis-pass: 12345678 

5.3.启动类上加入如下注解

java 复制代码
@EnableZlfRedisId 

开启redis分布式id生成器功能

5.4使用

java 复制代码
package xxxx.controller;

import com.zlf.dto.GeneratorIdDto;
import com.zlf.service.ZlfRedisIdByScripts1Service;
import com.zlf.service.ZlfRedisIdByScripts2Service;
import com.zlf.service.ZlfRedisIdByScripts3Service;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;

@RestController
@RequestMapping("id")
public class IdGcontroller {

    @Autowired
    private ZlfRedisIdByScripts1Service zlfRedisIdByScripts1Service;

    @Autowired
    private ZlfRedisIdByScripts2Service zlfRedisIdByScripts2Service;

    @Autowired
    private ZlfRedisIdByScripts3Service zlfRedisIdByScripts3Service;

    @GetMapping("getId1")
    public Long getId1() {
        GeneratorIdDto dto = new GeneratorIdDto();
        dto.setApplicationName("t_id1");
        dto.setTabName("id1");
        dto.setLength(16);
        return zlfRedisIdByScripts1Service.generatorIdByLength(dto);
    }

    @GetMapping("getId2")
    public Long getId2() {
        GeneratorIdDto dto = new GeneratorIdDto();
        dto.setApplicationName("t_id2");
        dto.setTabName("id2");
        return zlfRedisIdByScripts2Service.generatorId(dto);
    }

    @GetMapping("getId3")
    public Long getId3() {
        GeneratorIdDto dto = new GeneratorIdDto();
        dto.setApplicationName("t_id3");
        dto.setTabName("id3");
        return zlfRedisIdByScripts3Service.generatorId(dto);
    }

}

6.性能压测

单台redis机器压测可以抗住单机redis最大并发吞吐量,redis单台配置最大并发数可达100w,三台可达300w,由于我机器资源有限,使用的是一个redis压测1000000线程,循环1s,Ram-Up:1s由于会遇到一个apache-jmeter-5.6.3在windows下开了多个线程会导致TCPIP端口被占用,从而导致压测Jmeter 报错:

Address already in use: connect

所以解决办法是:

https://blog.csdn.net/qq_24857309/article/details/111477286

报错原因:
1、windows系统为了保护本机,限制了其他机器到本机的连接数.
2、TCP/IP 可释放已关闭连接并重用其资源前,必须经过的时间。关闭和释放之间的此时间间隔通称 TIME_WAIT 状态或两倍最大段生命周期(2MSL)状态。此时间期间,重新打开到客户机和服务器的连接的成本少于建立新连接。减少此条目的值允许 TCP/IP 更快地释放已关闭的连接,为新连接提供更多资源。如果运行的应用程序需要快速释放和创建新连接,而且由于 TIME_WAIT 中存在很多连接,导致低吞吐量,则调整此参数。

修改操作系统注册表
1、打开注册表:regedit
2、找到HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\TCPIP\Parameters
3、新建 DWORD值,name:TcpTimedWaitDe,value:30(十进制) ------> 设置为30秒(默认240)
4、新建 DWORD值,name:MaxUserPort,value:65534(十进制) ------> 设置最大连接数65534
注意:修改时先选择十进制,再填写数字。

5、重启系统
所以需要将注册表的TcpTimedWaitDe、MaxUserPort值修改,本文修改后压缩1000000,一百万线程还是会报这个错的,所以需要将MaxUserPort在改大一点。

由于我的机器资源有限,所以压测只做了一个简单的压测,没有做更详细的压测,压测结果还是可以的,性能吞吐量各方面还是可以的,有兴趣,有条件的可以去压测一下,如果压测了,有详细的压测报告,可以联系我,给我一份详细的压测报告,或者在压测或使用过程中发现啥问题,可以联系我,或者有啥好的修复方案也可以联系我,我们一起维护完善这个项目。

7.缺点

本文基于redis-lua脚本实现的分布式id生成器starter有一个缺点就是,不能去清理redis生成使用的database库或这个database库里面跟id生成有关key的信息,否则清理之后重新生成id会重复,所以对于第一种实现需要重新修改id的长度来避免,第二种和第三种实现是没有长度可以修改的,第三种可以修改分区,这个本文实现没有对这个分区做拓展,所以除了第二种没有解决方法,第三种应该不会有影响,只要保证使用本文依赖包所在服务器和redis的服务器的时钟正常即可,第一二种实现不会有时钟回拨的问题,时间取决于使用依赖应用所在服务器的时间,实现三取决于redis服务的时钟,所以还是确保应用服务器、redis集群服务器的时钟都是正常的,那么生成的id就不会有啥问题的,也更加准确,第一种实现生成的id可读性更好一点,但是是牺牲了前几位站位代价的,这就意味着前面格式占位越多,后面可用序列的长度就越短,生成可用的序列号就越少,这就是一个取舍。

8.总结

本文手写基于redis-lua脚本实现的分布式id生成器starter分享到此结束了,我把我手写的轮子开源出去,可以让java又多了一种分布式id生成的选择,解决了分布式id生成的问题,开源才能繁荣,通过本文的分享和之前文章的分享,在解决分布式id生成问题选择上丰富起来了,各种实现上基本都是类似和相通的,希望我的分享对你有所启发和帮助,请一键三连!

相关推荐
小宋102121 分钟前
玩转RabbitMQ声明队列交换机、消息转换器
服务器·分布式·rabbitmq
小安运维日记1 小时前
Linux云计算 |【第四阶段】NOSQL-DAY1
linux·运维·redis·sql·云计算·nosql
懒洋洋的华3696 小时前
消息队列-Kafka(概念篇)
分布式·中间件·kafka
码农郁郁久居人下6 小时前
Redis的配置与优化
数据库·redis·缓存
March€6 小时前
分布式事务的基本实现
分布式
Hsu_kk8 小时前
Redis 主从复制配置教程
数据库·redis·缓存
DieSnowK8 小时前
[Redis][环境配置]详细讲解
数据库·redis·分布式·缓存·环境配置·新手向·详细讲解
Lill_bin9 小时前
深入理解ElasticSearch集群:架构、高可用性与数据一致性
大数据·分布式·elasticsearch·搜索引擎·zookeeper·架构·全文检索
qingcyb16 小时前
下载Kafka 3.0.0教程
分布式·kafka
Lill_bin17 小时前
Lua编程语言简介与应用
开发语言·数据库·缓存·设计模式·性能优化·lua