1. 缓存击穿、缓存穿透和缓存雪崩
缓存失效的问题:缓存击穿、缓存穿透和缓存雪崩,都会导致缓存失效!
缓存击穿:(高频热点数据key失效)
-
问题描述(一般只的是查同一条数据)
- 缓存击穿是指缓存中没有但数据库中有的数据(一般是热点数据key的缓存时间到期),这时由于并发用户特别多,同时读缓存没读到数据,又同时去数据库去取数据,引起数据库压力瞬间增大,造成过大压力
-
解决方案
-
设置热点数据永远不过期
-
设置互斥锁:大量并发请求时,只有第一个请求线程能拿到锁并执行数据库查询操作,其他的线程拿不到锁就等待,等到第一个线程将数据写入缓存后,其他线程直接走缓存,不用再去查数据库。
-
缓存穿透:(查询不存在数据)
-
问题描述
- 缓存穿透是指查询一个一定不存在的数据,由于缓存不命中时需要从数据库查询,查不到数据则不写入缓存,导致每次请求都需要从数据库中读取数据,增加了数据库的负担。
-
解决方案
-
对查询结果为null的数据进行缓存,缓存有效时间可以设置短点
-
使用布隆过滤器:将所有可能存在的数据哈希到一个足够大的bitmap中,一个一定不存在的数据会被这个bitmap拦截掉,从而避免了数据库的查询压力。
-
接口层增加校验,如用户鉴权校验,id做基础校验,id<=0的直接拦截
-
设置黑名单(ip-->fail count)
-
缓存雪崩:(大面积key同时失效)
-
问题描述
- 缓存雪崩是指缓存中数据大批量到过期时间,而查询数据量巨大,引起数据库压力过大甚至down机。和缓存击穿不同的是,缓存击穿指并发查同一条数据,缓存雪崩是不同数据都过期了,很多数据都查不到从而查数据库。
-
解决方案
-
缓存数据的过期时间设置随机,防止同一时间大量数据过期现象发生。
-
如果缓存数据库是分布式部署,将热点数据均匀分布在不同得缓存数据库中。
-
设置热点数据永远不过期。
-
2. Redis缓存淘汰策略有哪些?
主要有以下几种策略:
-
volatile-lru:从已设置过期时间的数据集(server. db[i]. expires)中,挑选最近最少使用的数据淘汰。
-
volatile-ttl:从已设置过期时间的数据集(server. db[i]. expires)中,挑选距离过期时间最近的数据淘汰。
-
volatile-random:从已设置过期时间的数据集(server. db[i]. expires)中,随机选择数据淘汰。
-
allkeys-lru:从所有数据集(server. db[i]. dict)中,挑选最近最少使用的数据淘汰。
-
allkeys-random:从所有数据集(server. db[i]. dict)中,随机选择数据淘汰。
-
noeviction:不淘汰任何数据,当内存满时,新的写入操作会报错。
具体如何配置:
-
在Redis的配置文件redis.conf,找到如下的配置项:
XMLmaxmemory <bytes> # 设置Redis使用的内存上限 maxmemory-policy noeviction # 设置淘汰策略
-
当Redis使用的内存达到maxmemory设置的上限时,会按照maxmemory-policy设置的策略进行淘汰数据
3. 如何保证缓存和数据库的一致性
策略1:先更新数据库,再删除缓存
- 问题:A查缓存没有,读数据库5,正准备放到缓存; B更新数据库6,删除缓存,A设置缓存5
策略2: 先删除缓存,再更新数据库
- 问题: A删除缓存,准备更新数据库6 ; B查缓存没有,查数据库5,设置缓存5,A更新数据库6
策略3: 先删除缓存,再更新数据库,再延迟删除缓存(延迟双删)
-
问题: A删除缓存,准备更新数据库6 ; B查缓存没有,查数据库5,设置缓存5,A更新数据库6
-
解决:A更新数据库后,延迟N秒,再删除一下缓存
策略3的这种方式,称为延迟双删!
-
原理:先删除缓存,然后更新数据库,最后(延迟N秒)再执行删除缓存。进行两次删除,且中间需要延迟一段时间。
-
延迟时间要大于一次写操作的时间。原因:如果延迟时间小于写入redis的时间,会导致请求1清除了缓存,但是请求2缓存还未写入的尴尬。
延迟双删策略只是一种同步数据库与缓存的手段,在系统并发量不高的情况下可以使用这种方式解决,如果是并发量高的情况下,可以另寻其他解决方案,如使用canal
更好的方案,要借助于中间件canal,它能分析和收集binlog的日志结果。binlog是mysql自带的增、删、改的日志机制,但默认没有启用,要先启用。
4. Redis 是单线程的还是多线程的?
通常说 Redis 是单线程的。
-
其实主要是指 Redis 对外提供键值存储服务的主要流程, 即网络 IO 和键值存储服务是由⼀个线程来完成的。
-
除此之外外的其他功能, 如持久化、 缓存过期、集群同步等,是由额外的线程执⾏的。 防止有同步阻塞,导致主线程被占用影响后续的逻辑执行。
为什么Redis是单线程的
-
官方FAQ表示,因为Redis是基于内存的操作,CPU不是Redis的瓶颈,Redis的瓶颈最有可能是机器内存的大小或者网络带宽。
-
既然单线程容易实现,而且CPU不会成为瓶颈,那就顺理成章地采用单线程的方案了。
Redis6.0 引入多线程
-
多线程是 Redis6.0 推出的一个新特性。
-
主要是为了解决网络 I/O 的瓶颈,提高Redis在高并发和网络延迟的场景下的性能和吞吐量,更好的利用多核CPU的硬件资源。
-
在 Redis6.0 中,多线程机制默认是关闭的,需要手动开启。