深入探讨redis：缓存

什么是缓存

使用redis作为mysql的缓存

缓存的更新策略

定期生成

什么是缓存

缓存的核新思路就是把⼀些常用的数据放到触手可及(访问速度更快)的地方，方便随时读取。

比如我们一般都把钱存在银行，并且会拿出一部分出来放在自己的钱包里用来日常开销，那么这个钱包就相当于银行的缓存，我们为了不每次用钱的时候都去银行取，所以用个钱包在钱包里放一部分钱要使用的时候直接从钱包里拿(不考虑电子支付)。

对计算机来说，速度往往和存储空间是成反比的，访问速度越快存储空间越小，redis是读内存的访问速度要比Mysql快但空间也比mysql小很多，所以一般缓存里只会放一些(热点数据)会频繁访问的数据。虽然只放一些热点数据，但是也已经能应付大部分的情况了。

二八定律

这是一个经验规律，就是20%的热点数据能够应付80%的访问场景，所以只需要把少量热点数据用缓存存储起来，就可以应对大多数场景了。

使用redis作为mysql的缓存

像mysql这样的关系型数据库，虽然功能强大但是效率一般不高，处理并发能力也较弱因为

数据库会把数据存储在硬盘，存硬盘的访问速度要远小于存内存
如果查询不能命中索引，就要进行表遍历，大大增肌IO次数。
关系型数据库会对sql的执行做一系列的解析，校验，优化等。
一些联合查询比如需要进行笛卡尔积的操作，更是会降低效率

如果某一时刻并发量太大超过了数据库所能承担的极限，那么数据库的压力就会很大就容易出问题。想要提高数据库的并发量有两种方法

开源：引入更多的机器
节流：引入缓存，把一些热点数据放在缓存上分别查询。

而redis就具有很好的处理缓存的功能因为，redis的数据保存在内存上访问速度较快，而且redis只是简单的键值对存储，不会涉及复杂的查询规则，将redis用作mysql的缓存就可以很好的帮助mysql分担很大一部分并发量。

缓存的更新策略

定期生成

策略：每隔一定的周期(一天/一周/...)，对于访问的数据的频率进行一个统计，挑选出前N%频率的数据作为热点数据保存在缓存中。

可以使用shell或python写一个脚本通过定时任务来触发

完成统计热热点数据

根据热点数据，找到对应的结果

把得到的缓存同步到缓存服务器上

控制这些缓存服务器重启

这种方法的优点就是，操作比较简单过程更为可控(缓存中有什么是比较固定的)，方便排查问题

缺点就是，实时性不够，如果遇到一些突发事件，有一些数据突然变成热点数据，那么新的热点数据就有可能给数据库造成较大压力。

实时生成

策略：如果在redis中查到了就直接返回，如果没有查到，就从数据库中查，然后再把查到的结果也写入redis中。

虽然这种方法的实时性比定期生成好，但是不断的向redis中写入数据，就会让内存空间越来越小最后达到上限 (redis的空间上限不一定就是内存空间，可以通过设置maxmemory属性来决定给redis分配多少内存空间)。

所以针对上述问题，就需要进行内存空间的淘汰给一些不需要的数据淘汰掉。

淘汰的策略有以下几种：

FIFO(First In FirstOut)先进先出：记录每个key的最近访问时间.把最近访问时间最老的key淘汰掉。
**LRU(Least Recently Used)淘汰最久未使用的：**记录每个key的最近访问时间.把最近访问时间最老的key淘汰掉
LFU(Least Frequently Used)淘汰访问次数最少的：记录每个key最近⼀段时间的访问次数.把访问次数最少的淘汰掉
Random随机淘汰：从所有的key中抽取幸运儿被随机淘汰掉

这些淘汰策略并不局限于redis，其他缓存也可以这样展开

下面是redis内置的淘汰策略：

volatile-lru：当内存不足以容纳新写入数据时，从设置了过期时间（包括过期时间还没到）的key中使用LRU（最近最少使用）算法进行淘汰。
allkeys-lru： 当内存不足以容纳新写入数据时，从所有key中使用LRU（最近最少使用）算法进行淘汰。
volatile-lfu： 4.0版本新增，当内存不足以容纳新写入数据时，在过期的key中，使⽤LFU算法进行删除key。
allkeys-lfu： 4.0版本新增，当内存不足以容纳新写入数据时，从所有key中使用LFU算法进行淘汰。
volatile-random： 当内存不足以容纳新写入数据时，从设置了过期时间的key中，随机淘汰数据。
allkeys-random： 当内存不足以容纳新写入数据时，从所有key中随机淘汰数据。
volatile-ttl：在设置了过期时间的key中，根据过期时间进行淘汰，越早过期的优先被淘汰。(相当于FIFO,只不过是局限于过期的key)
**noeviction(默认)：**当内存不足以容纳新写入数据时，新写入操作会报错（不适合实时更新）。

整体来说Redis提供的策略和我们上述介绍的通策略是基本⼀致的，只不过Redis这里会针对过期

key和全部key做分别处理。

缓存预热

如果缓存中的数据是实时更新，那么当redis服务器首次接入后，里面是没有数据的，所以此时所有请求都会发送给mysql，可能会给mysql带来很大的压力。

缓存预热就是用来解决上述问题

通过把定期生成和实时生成结合，先通过离线的方式，统计一批热点数据，然后导入redis中，这是导入的热点数据就可以帮助mysql承担很多压力了，最后随着时间的推移，刚开始的热点数据慢慢被新的热点数据替代。

缓存穿透

当请求查询某个key时，redis和mysql中都没有，那么这个key也不会被更新到缓存中，所以这种请求都会被打给mysql，如果存在很多这样的请求，就会给mysql带来很大的压力。

引起这种问题的原因可能是：

业务设计不合理，缺少校验key的环节，导致非法的key没有被拦截
不小心把这些数据在数据库上删除了所以访问不到
黑客攻击

解决方法

更改业务逻辑，加强监控捕捉

**缓存空对象：**如果发现这个key在redis和mysql上都不存在的话，依然将这个数据保存到redis中，并且给value设置为空，这样再有这个数据请求时就可以再redis上访问到并返回一个空，这种方法虽然简单但是也有缺点，额外的内存消耗，可能造成短期的不一致。
**布隆过滤：**引入布隆过滤器，每次查询redis之前，都先判定以下key是否再布隆过滤器上存在，这种方法内存占用较少，没有多余key。但是实现复杂，存在误判可能。

缓存雪崩

由于在短时间内redis上的key大规模失效，或者redis直接宕机，导致缓存命中率下降，导致大量请求到达数据库，带来巨大压力。

key大规模失效的原因可能时之前短时间内给大量的key设置了相同的过期时间

解决方法

部署高可用的Redis集群，并且完善监控报警体系
不给key设置过期时间或者设置过期时间的时候添加随机时间因子

缓存击穿(瘫痪)

缓存击穿也叫热点key问题，相当于缓存雪崩的特殊情况，就是正对热点key突然过期了，而且此时又有大量的请求过来，就会导致这些请求都直接访问到mysql上，给mysql产生极大压力甚至宕机。

解决方法

基于统计的方式发现热点key并且设置过期时间为永不过期
进行必要的服务降级(关闭一些其他功能只保留核心功能)，比如访问数据库的时候使用分布式锁，限制同时请求数据库的并发量。