Redis-高级篇(分布式缓存/持久化)

文章目录

Redis持久化
- RDB
- AOF
- [RDB 和 AOF区别](#RDB 和 AOF区别)
分布式缓存

Redis持久化

RDB

RDB也叫做Redis数据快照。就是把内存中的所有数据记录到磁盘中，当Redis实例故障重启后，从磁盘中读取文件，恢复数据。快照文件默认保存在当前运行目录。

通过如下命令可以使redis执行RDB

Redis内部也有触发RDB的机制

redis.conf文件中保存触发RDB触发的条件

bgsave执行原理

主线程开辟一个子线程，将对应的页表fork进子线程，子线程从页表获取到内存物理地址，然后进行读写到磁盘文件中

页表：记录内存物理地址和逻辑地址的表，该概念来自于操作系统，所有进程操作内存都是通过页表，操作逻辑地址去操作，而不是直接读写物理内存

注意：主进程接收新的写操作，不会直接写到物理内存中（因为这样会造成子线程的脏读），所以写的时候遵循copy-on-write，会先创建一个数据B副本，将数据B拷贝入数据B副本，然后对这个副本进行写操作，RDB执行完后再将副本拷贝入内存"

极端情况下，可能RDB没有完成，所有数据都创建了副本，相当于占用了原redis存储数据的两倍的空间

RDB缺点：RDB执行有时间间隔，两次RDB之间写入数据有丢失的风险；fork子进程，压缩，写入RDB文件都比较耗时。

AOF

Redis处理的每一个命令都会记录在AOF文件中，可以看作是命令日志文件，如下图：

AOF默认是关闭的，需要修改redis.conf配置文件来开启AOF

AOF的命令记录频率也可以通过reids.conf文件配置

不同配置项的优劣

因为是记录命令，AOF文件会比RDB文件大得多，而且AOF会记录对同一个key的多次写操作，但只有最后一次写操作才有意义，通过执行bgrewriteaof命令，可以让AOF文件执行重写操作，用最少的命令达到相同的效果。如下图

也可以在redis.conf配置达到某个阈值时自动去重AOF文件(bgrewirteaof)，如下图：

RDB 和 AOF区别

分布式缓存

redis主从架构

单节点的Redis并发能力有上限，要进一步提高Redis的并发能力，需要搭建主从集群，实现读写分离，向主节点写，去从节点读，主从节点实现数据同步，结构如下图：

创建三台redis实例有很多方法，比如docker。或者创建三个目录并在其中配置好redis.conf，分别启动就可以了，具体步骤不仔细讲解了，此时三个实例还没有任何关系，要配置主从可以使用replicaof或者saveof命令，有以下两种模式：

这里启动了三个实例，然后让7002和7003端口的实例作为7001实例的从节点

左上角是操作窗口，其他三个窗口分别的7001,7002，7003的启动窗口

查看集群效果

连接7001输入INFO replication命令

两个salve（从节点）

测试

在主节和从节点上分别执行写和读操作可以执行成功，再从节点上执行写操作就报错，可知读写分离成功，如下图

为什么从节点写入失败，是因为如果从节点可以执行写入操作，那么从节点的数据永远不可能与主节点数据一致，因为主节点无法通过从节点拷贝写入的数据。

数据同步

节点之间的数据同步

主从节点如何进行数据的同步

全量同步

主从第一次同步就是全量同步，流程如下

这个流程图挺清楚的

那master怎么判断slave是不是第一次来同步数据？

这里先介绍每一个redis都会有的两个属性，判断是否是第一次关键

从redis第一次同步的时候Replication Id肯定是和主节点不一致的

所以全量同步的过程就是如下图：slave来和master同步时，会携带replid和offset，replid不一致就说明是第一次来，然后master就会返回自己的replid和offest，slave记录这两个值，以后来时都携带上和master做增量同步。

第一阶段用具体代码代替原来的说明后

增量同步

主从第一次同步是全量同步，slave后续的同步就是增量同步，过程如下图

注意：repl_baklog是一个数组，大小有上限，写满后会覆盖最早的数据，如果slave断开时间太长，导致尚未备份的数据被覆盖，则无法基于log做增量同步，只能再次全量同步。

主从优化

在master中配置repl-diskless-sync yes启用无磁盘复制，就是RDB不写入I/O流中，直接写入网络中传输给slave

全量同步时，正常将RDB先写入磁盘，然后通过网络传给salve，这个配置就是直接写入网络流中，少了一次IO写磁盘操作

Redis单节点上的内存占用不要太大，减少RDB导致的过多磁盘I/O
适当提高repl_baklog的大小，发现slave宕机时尽快实现故障恢复，尽可能避免全量同步
限制一个master上的slave节点数量，如果slave实在太多，可以采用"主-从-从"的链式结构，减少master压力，如下图
即从1节点作为从2节点的主节点，这样从1节点还是可以去读

哨兵模式

Redis提供了哨兵机制来实现主从集群的自动故障恢复，哨兵结构图如下：

1.哨兵集群搭建

首先创建三个目录，然后生成三个sentinel.conf文件，这三个目录是不同sentinel运行的目录，文件配置如下图，然后把端口改成三各不一样的，把配置文件分别放入三个目录中：

先启动我们的sentinel，三个都启动

这样的话snetinel集群就已经开始检测我们的redis主从集群了

这时可以让master宕机（手动关闭），发现有一个slave变成了master，原先的master重启后变成了slave

2.哨兵作用

1.监控：Sentinel会不断地检查master和slave是否按期工作。
2.自动故障恢复：如果master故障，Sentinel会将一个slave提升为master，当故障实例恢复后也以新的master为主。
3.通知：Sentinel充当Redis客户端的服务发现来源，当集群发生故障转移时，会将最新的消息推送给Redis的客户端。

3.服务状态监控

Sentinel基于心跳机制检测服务状态，每隔一秒向集群的每个实例发送ping命令

1.主观下线：如果某个sentinel节点发现某个实例未在规定时间响应，则认为该实例主观下线。
2.客观下线：若规定指定数量(quorum)的sentinel都认为该实例主观下线，则认为该实例客观下线，quorum的值最好超过Sentinel实例数量的一半。
只有sentinel认为redis主从的master客观下线后，才会选举新的master节点

4.选举新master依据

一旦发现master故障，sentinel需要在slave中选择一个作为新的master，选择依据如下：

1.首先判断slave与master节点断开时间长短，如果超过指定值(down-after-milliseconds*10)则会排除该slave。（先排除数据过旧节点）
2.然后判断slave的slave-priority值，越小优先级越高，如果是0则用不参加选举。（默认都是1）
3.如果slave-priority值一样，则判断slave的offest值，越大说明数据越新，优先级越高。
4.最后是判断slave节点的运行id，越小优先级越高。