redis面试（八）watchdog看门狗代码逻辑

某个客户端上锁了之后，一直比如过了5分钟，10分钟，都没释放掉这个锁，那么你觉得会怎么样呢？锁对应的key刚开始的生存周期其实就是30秒而已，难道是默认情况下30秒后这个锁就自动释放？？？

lock watchdog，你对anyLock这个key加锁了以后，然后后台有一个定时调度的一个watchdog任务，这个任务的话呢其实就是每隔一定时间，10秒左右，延长一下anyLock这个key的生存周期，重新延长到30秒

只要你的这个lock没有释放掉，那么这个后台的watchdog他就会不断的去重复延长这个key的生存周期，对应的就是你的客户端长期的5分钟，10分钟，30分钟，一直持有了某一个key对应的分布式锁

首先从源码的层面，带着大家来看一下，如果你成功的对某个key加锁了之后，后台的定时调度任务（lock watchdog）是如何每隔10秒钟去延长一下那个key的生存时间的？

RFuture ttlRemainingFuture = tryLockInnerAsync()

我们上一节可以知道，tryLockInnerAsync这个方法中返回的是lua脚本执行之后，得到的这个key剩余的存在时间，不传的话默认是3000毫秒，也就是3秒钟。

那看下面的addListener()逻辑，这一看就是要加一个监听。

首先(!future.isSuccess()) 先判断上面加锁是否成功，如果不成功的话就直接返回不用管了，成功的话就取出来当前的剩余有效期，有效期也不为空的话，就去执行监听逻辑

还有一个判断，是返回值是否为null，如果为null的话才是加锁成功，不为null的话是失败

scheduleExpirationRenewal()方法按照字面意思看的话，就是时间过期更新。很明显，这里一定和看门狗逻辑有关系。我们去看看里面的逻辑

第一行很简单expirationRenewalMap.containsKey(getEntryName())

就是判断一下expirationRenewalMap 中是否存在这样一个key，如果不存在的话再执行下面的逻辑。

第一次进来肯定是不包含的。

继续往下，就是开启了一个定时调度任务，传入了一个TimerTask对象和 internalLockLeaseTime

internalLockLeaseTime默认是30000毫秒也就是 30秒，除以3 就是10秒

意思是这个TimerTask对象中的逻辑要等待10s中再执行

那执行TimerTask.run()方法的时候，先执行RFuture future = renewExpirationAsync(threadId);

这行代码，renewExpirationAsync()方法，更新过期时间

"if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) then " +

"redis.call('pexpire', KEYS[1], ARGV[1]); " +

"return 1; " +

"end; " +

"return 0;",

判断这个锁是否还存在，如果存在的话，将过期时间更新为30s。

（PS: 题外话果然，这里只更新了过期时间，并没有更新原本的value值）

当前情况是，已经等待了10s，这个线程还持有这把锁，有效期只剩下20s，那现在看锁还存在，就更新过期时间为30s。

再回到之前的逻辑中看，延长完有效期，如果成功的话，会往下执行，再次进入本方法scheduleExpirationRenewal()

也就是说会再等待10s中，然后再判断锁是否存在，存在的话更新过期时间为30s，不存在的话，从这个方法中返回。执行下面的判断逻辑

将这个锁放入expirationRenewalMap中，下次再进入scheduleExpirationRenewal()方法，判断map中有值，就不会再执行更新过期时间的方法了。

这就是看门狗的一个不断更新逻辑，这时候有个问题，就是如果主机宕机了怎么释放锁？

很简单，如果宕机了，那么这台主机上的这个看门狗逻辑就不会再执行了，那么过30s之后，这个锁就会自动过期，其他主机就可以获取到这把锁了。

总结

就是在加锁之后，注册一个线程监听，每10s循环判断线程是否还存在。如果监听到线程不在了，就不再执行，如果锁缓存不在了，就不在延长时间。