大家好,我是徒手敲代码。
今天来介绍一下分布式锁。首先思考下这些问题:
- 为什么需要分布式锁?
- 基于 Redis 如何实现分布式锁?
- 单纯使用
setNx
命令来加锁,会存在什么问题? - 经常听到的
RedLock
,是百分百完美的方案吗? - 除了 Redis,还有其他的解决方案吗?
因为篇幅问题,本文主要解决前三个问题。
为什么需要分布式锁
一个新技术的诞生,往往是现有的技术,无法满足业务需求。
与分布式锁相对应的,是单机锁。当我们在同一台机器,多个线程同时操作一个共享资源,那么通常会采用加锁的方式,只有获取到锁的线程,才能对共享资源进行访问,否则就要等待锁的释放,如下图:
如果业务需要拓展,单台服务器已经无法满足需求,单机系统需要拆分成多个微服务,分别部署在多台服务器上,如果还是使用单机锁的话,就会出现下图这种情况:
尽管每个服务各自都加了锁,但是这个锁只是 JVM 层面的,从数据库的角度看,还是同一时间有多个线程过来竞争。显然是会有问题的。
这个时候,就需要引入分布式锁了。想要实现分布式锁,需要引入一个外部系统,所有线程都要在这个外部系统上申请锁,只有申请到锁的线程,才能访问到共享资源。
而这个外部系统,可以是 MySQL、Redis、Zookeeper,接下来以Redis作为主线,来讲解分布式锁的实现。
Redis最简单的实现
利用 Redis 最简单的方式,就是使用setNx
这个命令,含义是 set if not exists
,这个key不存在,才设置它的值,否则直接返回。
比如:客户端1申请加锁,加锁成功:
bash
127.0.0.1:6379> setnx lock 666
(integer) 1
客户端2申请加锁,加锁失败:
bash
127.0.0.1:6379> setnx lock 666
(integer) 0
加锁之后,可以去修改共享资源数据,处理完成之后解锁:
bash
127.0.0.1:6379> del lock
(integer) 1
存在问题
简单的背后,往往要付出一些代价。正所谓easy come, easy go
死锁问题
第一,命令没有设置过期时间,那么如果获取到锁的客户端,在释放锁之前挂了,那么这个锁将变成死锁;针对这种情况,可以给锁设置一个过期时间,即使服务挂了,锁也会自动释放。
过期时间长短的问题
既然有了过期时间,那么这个时间设置多久呢?
假设业务处理的时间,预估最多不会超过10s,我们将过期时间设置成10s
如果过期时间太短,那么A线程还没有处理完业务,B线程就进来了,两个线程同时操作共享资源,会导致数据出现不一致问题;在A线程操作完成的时候,释放锁,此时释放的是B线程的锁。
而且在处理的过程中,情况可能最多不止10s,还有各种异常情况,比如:程序内部异常、网络超时等,预估的时间很难准确。
如果过期时间太长,会导致系统资源长时间被无意义地占用,大量请求需要排队等待,系统的性能会下降。
如何解决呢?
解决过期时间的问题
在加锁的时候,同样先设置一个过期时间,然后再开一个守护线程(称为看门狗线程),这个线程负责定时检测锁的过期时间,如果锁快过期了,但是业务处理还没有完成,那么就要为这个锁的持有线程续命一波,延长它的过期时间,在Java当中,可以直接使用Redisson这个库,内部已经封装好了接口。
解决锁被其他线程释放的问题
这个问题的关键在于,释放锁的时候,都是无脑操作,没有判断释放的锁是不是自己的。
那么我们就要加上这个判断。在客户端加锁的时候,设置一个唯一的标识,比如线程 id。解锁的时候,先判断一下锁是否还归自己所有。解锁过程可以写成lua
脚本让 Redis 执行:
vbnet
if redis.call("GET",KEYS[1]) == ARGV[1]
then
return redis.call("DEL",KEYS[1])
else
return 0
end
注意,单机部署的 Redis 可以这么玩,但是主从架构部署的 Redis 就不行了,下篇文章继续来分析。
今天的分享到这里结束了。
关注公众号"徒手敲代码",免费领取腾讯大佬推荐的Java电子书!