Redis实现分布式锁源码分析

为什么使用分布式锁

单机环境并发时,使用synchronized或lock接口可以保证线程安全,但它们是jvm层面的锁,分布式环境并发时,100个并发的线程可能来自10个服务节点,那就是跨jvm了。

简单分布式锁实现

SETNX

格式:setnx key value

当且仅当key不存在时,key能设置成功并返回1,否则返回0。

SETNX即SET if Not eXists 如果不存在。

SETNX存在的问题

高并发场景下,有可能存在key自动过期了,加锁的线程还未执行完成的情况。此时线程2加锁进来了,且刚好线程1执行完了,线程1会把线程2刚刚创建的锁删掉,导致后面进来了更多的线程。【自己加的锁被别人删除了】

解决方案:给每个加锁的key生成一个唯一的UUID作为value,删除之前,从redis拿出来的UUID与当前线程一致才能删除key。

然而finally依然存在问题,因为释放锁的代码不是原子操作。【超时零界点】,在判断uuid相同后,且还未删除key前,此时key超时了,其他线程加锁成功,当前线程执行delete命令时,删除的依然是其他线程加的锁。

以上问题均是由于锁的时间不够长导致,接下来的解决方案是【锁续命】

锁续命

原理 :线程1加锁成功后,再创建一个线程,使用定时任务来监控锁剩余时间。定时任务执行的周期必须小于锁的超时时间。比如锁超时时间默认设置为30秒,那么该线程每10秒执行一次,给锁重新设置超时时间为30秒, 保证主线程删除锁时,是自己加的锁。如果主线程已释放锁,子线程执行定时任务时会先判断主线程加的key是否还存在。 目前市面上已有成熟的解决方案,如redisson ,它适用于分布式各种场景。参考redisson帮助文档

Redisson续命锁流程

引入redisson的依赖包

<dependency>
   <groupId>org.redisson</groupId>
   <artifactId>redisson</artifactId>
   <version>3.27.2</version>
</dependency>  

创建一个Redisson的bean注册到Spring容器中

//获取锁对象
RLock redissonLock = redisson.getLock(lockKey);
//加分布式锁
redissonLock.lock();
........
//解锁
redissonLock.unlock(); 

Redisson加锁源码

底层是基于lua脚本实现,它能保证原子性。因为Redis服务端执行命令是单线程的,读到这一块lua代码会将它当成一个整体执行完,再去执行下一条命令。

第一步通过lua脚本加锁成后,返回null,加锁失败返回锁剩余时间
hset key field value 通过hash结构设置field为UUID+线程ID,value是1,表示重入次数。 key是构建锁时传入的redisson.getLock(lockKey); 锁超时时间默认是30秒。

第二步:看门狗机制给锁续命

Future模式异步执行lua脚本加锁,加锁成功后回调Future的监听器获取加锁结果。 加锁的lua脚本执行成功后返回null,则进入scheduleExpireRenewal()方法定时的给锁重置超时时间。

创建一个TimeTask延时任务,10秒后才执行run()方法,lua脚本判断锁存在则重设锁的超时时间为30秒。它同样是使用的Future模式,下面添加了一个监听,重置结束后,会回调监听器,监听器拿到结果再回调scheduleExpireRenewal()方法本身。

第三步:加锁失败的线程自旋等待

  1. 加锁失败后,先订阅该key的channel通道消息,类似于一个队列或topic,当锁在过期之前释放了,需要唤醒等待的线程竞争锁。
  2. 进入while(true)自旋加锁。先尝试一次加锁,成功则退出循环,失败则获取Semaphore调用tryAcquire()等待ttl 秒后,重新进入while(true)尝试获取锁。如果1000个线程同时结束等待,就会一起抢锁,所以该锁是非公平锁


    第四步:释放锁时,发布该key的channel消息,通知等待的线程竞争锁。
    一旦channel中有消息后,会执行LockPubSub.onMessage()方法,获取一个Semaphora信号量释放等待的线程,让他们竞争锁。

总结 :redisson的架构设计涉及到Future自旋锁看门狗机制发布订阅lua脚本semaphore 等技术。

它的lock()接口实现的是非公平锁 。tryAcquire()加锁成功后,继续执行业务代码。其他线程拿锁时返回锁剩余的时间ttl ,判断ttl 大于0,则使用Semaphore.getLatch().tryAcquire(),等到超时时间结束后再去抢锁。如果ttl 还没有变为0,此时锁已释放,主线程会向指定的channel发送一条消息,等待的线程会订阅这个消息LockPubSub.onMessage(),拿到释放锁的消息后调用Semaphore.getLatch().release(),唤醒阻塞的线程立刻抢锁。

主线程给锁续命使用的是Future机制,异步开启了一个线程,每隔10秒嵌套调用重设锁时间的方法。

lua脚本


相关推荐
java1234_小锋4 小时前
Zookeeper是如何解决脑裂问题的?
分布式·zookeeper·云原生
安的列斯凯奇4 小时前
分布式事务介绍 Seata架构与原理+部署TC服务 示例:黑马商城
分布式·架构
2401_871213304 小时前
zookeeper+kafka
分布式·zookeeper·kafka
想要入门的程序猿5 小时前
Qt菜单栏、工具栏、状态栏(右键)
开发语言·数据库·qt
键盘上的蚂蚁-6 小时前
Python 语言结合 Flask 框架来实现一个基础的代购商品管理
jvm·数据库·oracle
代码欢乐豆6 小时前
MongoDB的部署和操作
数据库·mongodb
<e^πi+1=0>6 小时前
使用Locust对MongoDB进行负载测试
数据库·mongodb
圆蛤镇程序猿7 小时前
【什么是MVCC?】
java·数据库·oracle
cmgdxrz7 小时前
性能测试05|JMeter:分布式、报告、并发数计算、性能监控
分布式·jmeter
开心邮递员7 小时前
sql server: split 函数;cross apply操作符
数据库·sql