Redis持久化、主从与哨兵架构详解

1. Redis持久化

1.1 RDB快照（snapshot）

在默认情况下，Redis将内存数据库快照保存在名字为dump.rdb的二进制文件中。

你可以对Redis进行设置，让它在"N秒内数据集至少有M个改动"这一条件被满足时，自动保存一次数据集。

比如说，以下设置会让Redis在满足"60秒内有至少有1000个键被改动"这一条件时，自动保存一次数据集：

bash 复制代码

#save 60 1000 
//关闭RDB只需要将所有的save保存策略注释掉即可

还可以手动执行命令生成RDB快照，进入redis客户端执行命令save或bgsave可以生成dump.rdb文件，每次命令执行都会将所有redis内存快照到一个新的rdb文件里，并覆盖原有rdb快照文件。

bgsave 的写时复制(COW)机制

Redis借助操作系统提供的写时复制技术（Copy-On-Write,COW），在生成快照的同时，依然可以正常处理写命令。简单来说，bgsave子进程是由主线程fork生成的，可以共享主线程的所有内存数据。

bgsave子进程运行后，开始读取主线程的内存数据，并把它们写入RDB文件。此时，如果主线程对这些数据也都是读操作，那么，主线程和bgsave子进程相互不影响。但是，如果主线程要修改一块数据，那么，这块数据就会被复制一份，生成该数据的副本。然后，bgsave子进程会把这个副本数据写入RDB文件，而在这个过程中，主线程仍然可以直接修改原来的数据。

命令	save	bgsave
IO类型	同步	异步
是否阻塞redis其它命令	是	否(在生成子进程执行调用fork函数时会有短暂阻塞)
复杂度	O(n)	O(n)
优点	不会消耗额外内存	不阻塞客户端命令
缺点	阻塞客户端命令	需要fork子进程，消耗内存
[save与bgsave对比：]

配置自动生成rdb文件后台使用的是bgsave方式。

1.2 AOF（append-onlyfile）

快照功能并不是非常耐久（durable）：如果Redis因为某些原因而造成故障停机，那么服务器将丢失最近写入、且仍未保存到快照中的那些数据。从1.1版本开始，Redis增加了一种完全耐久的持久化方式：AOF持久化，将修改的每一条指令记录进文件appendonly.aof中(先写入oscache，每隔一段时间fsync到磁盘)

比如执行命令**"set zhuge 666"**，aof文件里会记录如下数据

bash 复制代码

*3
$3
set
$5
zhuge
$3
666

这是一种resp协议格式数据，星号后面的数字代表命令有多少个参数，$号后面的数字代表这个参数有几个字符

注意，如果执行带过期时间的set命令，aof文件里记录的是并不是执行的原始命令，而是记录key过期的

时间戳

比如执行 "set tuling 888 ex 1000"，对应aof文件里记录如下

bash 复制代码

*3
$3
set
$6
tuling
$3
888
*3
$9
PEXPIREAT
$6
tuling
$13
1604249786301

你可以通过修改配置文件来打开AOF功能：

bash 复制代码

# appendonly yes

从现在开始，每当 Redis 执行一个改变数据集的命令时（比如SET），这个命令就会被追加到AOF文件的末尾。

这样的话，当 Redis 重新启动时，程序就可以通过重新执行AOF文件中的命令来达到重建数据集的目的。

你可以配置 Redis 多久才将数据 fsync 到磁盘一次。

有三个选项：

bash 复制代码

appendfsync always ：每次有新命令追加到 AOF 文件时就执行一次 fsync，非常慢，也非常安全。
appendfsync everysec：每秒 fsync 一次，足够快，并且在故障时只会丢失1秒钟的数据。
appendfsync no：从不 fsync，将数据交给操作系统来处理。更快，也更不安全的选择。

推荐（并且也是默认）的措施为每秒 fsync 一次，这种 fsync 策略可以兼顾速度和安全性。

1.3 AOF重写

AOF文件里可能有太多没用指令，所以AOF会定期根据内存的最新数据生成aof文件例如，执行了如下几条命令：

bash 复制代码

127.0.0.1:6379>incr readcount
(integer) 1
127.0.0.1:6379>incr readcount
(integer) 2
127.0.0.1:6379>incr readcount
(integer) 3
127.0.0.1:6379>incr readcount
(integer) 4
127.0.0.1:6379>incr readcount
(integer) 5

重写后AOF文件里变成

bash 复制代码

*3
$3
SET
$2
readcount
$1
5

如下两个配置可以控制 AOF 自动重写频率

bash 复制代码

#auto‐aof‐rewrite‐min‐size 64mb // aof 文件至少要达到 64M 才会自动重写，文件太小恢复速度本来就很快，重写的意义不大
#auto‐aof‐rewrite‐percentage 100 // aof 文件自上一次重写后文件大小增长了 100%则再次出发重写

当然 AOF 还可以手动重写，进入redis客户端执行命令 bgrewriteaof 重写AOF

注意，AOF重写redis会fork出一个子进程去做(与bgsave命令类似)，不会对redis正常命令处理有太多影响

RDB和AOF，我应该用哪一个？

命令	RDB	AOF
启动优先级	低	高
体积	小	大
恢复速度	快	慢
数据安全性	容易丢数据	根据策略决定

生产环境可以都启用，redis 启动时如果既有 rdb 文件又有 aof 文件则优先选择 aof 文件恢复数据，因为 aof 一般来说数据更全一点。

1.4 Redis4.0混合持久化

重启Redis时，我们很少使用RDB来恢复内存状态，因为会丢失大量数据。我们通常使用AOF日志重放，但是重放AOF日志性能相对RDB来说要慢很多，这样在Redis实例很大的情况下，启动需要花费很长的时间。Redis4.0为了解决这个问题，带来了一个新的持久化选项------混合持久化。

通过如下配置可以开启混合持久化(必须先开启aof)：

bash 复制代码

# aof‐use‐rdb‐preamble yes

如果开启了混合持久化，AOF在重写时 ，不再是单纯将内存数据转换为RESP命令写入AOF文件，而是将重写这一刻之前的内存做RDB快照处理，并且将RDB快照内容和增量的AOF修改内存数据的命令存在一起，都写入新的AOF文件，新的文件一开始不叫appendonly.aof，等到重写完新的AOF文件才会进行改名，覆盖原有的AOF文件，完成新旧两个AOF文件的替换。

于是在Redis重启的时候，可以先加载RDB的内容，然后再重放增量AOF日志就可以完全替代之前的AOF全量文件重放，因此重启效率大幅得到提升。

Redis数据备份策略：

写crontab定时调度脚本，每小时都copy一份rdb或aof的备份到一个目录中去，仅仅保留最近48小时的备份
每天都保留一份当日的数据备份到一个目录中去，可以保留最近1个月的备份
每次copy备份的时候，都把太旧的备份给删了
每天晚上将当前机器上的备份复制一份到其他机器上，以防机器损坏

2. Redis主从架构

redis主从架构搭建，配置从节点步骤：

bash 复制代码

1、复制一份 redis.conf文件

2、将相关配置修改为如下值：
port 6380
pidfile /var/run/redis_6380.pid
#把pid进程号写入pidfile配置的文件
logfile "6380.log"
dir /usr/local/redis‐5.0.3/data/6380 #指定数据存放目录
# 需要注释掉 bind
# bind 127.0.0.1（bind绑定的是自己机器网卡的ip，如果有多块网卡可以配多个ip，代表允许客户端通过机的哪些网卡ip去访问，内网一般可以不配置bind，注释掉即可）

3、配置主从复制 
replicaof 192.168.0.60 6379 #从本机6379的redis实例复制数据，Redis 5.0之前使用slaveof
replica‐read‐only yes #配置从节点只读

4、启动从节点
redis‐server redis.conf

5、连接从节点
redis‐cli ‐p 6380

6、测试在 6379 实例上写数据，6380 实例是否能及时同步新修改数据

7、可以自己再配置一个 6381 的从节点

2.1 Redis主从工作原理

如果你为master配置了一个slave，不管这个slave是否是第一次连接上Master，它都会发送一个PSYNC命令给master请求复制数据。

master收到PSYNC命令后，会在后台进行数据持久化通过bgsave生成最新的rdb快照文件，持久化期间，master会继续接收客户端的请求，它会把这些可能修改数据集的请求缓存在内存中。当持久化进行完毕以后，master会把这份rdb文件数据集发送给slave，slave会把接收到的数据进行持久化生成rdb，然后再加载到内存中。然后，master再将之前缓存在内存中的命令发送给slave。

当master与slave之间的连接由于某些原因而断开时，slave能够自动重连Master，如果master收到了多个slave并发连接请求，它只会进行一次持久化，而不是一个连接一次，然后再把这一份持久化的数据发送给多个并发连接的slave。

主从复制(全量复制)流程图：

数据部分复制

当master和slave断开重连后，一般都会对整份数据进行复制。但从redis2.8版本开始，redis改用可以支持部分数据复制的命令PSYNC去master同步数据，slave与master能够在网络连接断开重连后只进行部分

数据复制(断点续传)。

master会在其内存中创建一个复制数据用的缓存队列，缓存最近一段时间的数据，master和它所有的slave都维护了复制的数据下标offset和master的进程id，因此，当网络连接断开后，slave会请求master继续进行未完成的复制，从所记录的数据下标开始。如果master进程id变化了，或者从节点数据下标offset太旧，已经不在master的缓存队列里了，那么将会进行一次全量数据的复制。

主从复制(部分复制，断点续传)流程图：

如果有很多从节点，为了缓解主从复制风暴(多个从节点同时复制主节点导致主节点压力过大)，可以做如下架构，让部分从节点与从节点(与主节点同步)同步数据

Jedis连接代码示例：

1、引入相关依赖：

XML 复制代码

<dependency>
    <groupId>redis.clients</groupId>
    <artifactId>jedis</artifactId>
    <version>2.9.0</version>
</dependency>

访问代码：

java 复制代码

package com.redxun.eip.controller.jobController;

import redis.clients.jedis.Jedis;
import redis.clients.jedis.JedisPool;
import redis.clients.jedis.JedisPoolConfig;
import redis.clients.jedis.Pipeline;

import java.util.Arrays;
import java.util.List;

/**
 * @Author hw
 * @Date 2024/9/30 14:50
 * @PackageName:com.redxun.eip.controller.jobController
 * @ClassName: JedisSingleTest
 * @Description: TODO
 * @Version 1.0
 */
public class JedisSingleTest {
    public static void main(String[] args) {
        JedisPoolConfig jedisPoolConfig = new JedisPoolConfig();
        jedisPoolConfig.setMaxTotal(20);
        jedisPoolConfig.setMaxIdle(10);
        jedisPoolConfig.setMaxWaitMillis(5);
        //timeout，这里既是连接超时又是读写超时，从Jedis2.8 开始有区分 connectionTimeout 和soTimeout 的构造函数

        JedisPool jedisPool = new JedisPool(jedisPoolConfig, "127.0.0.1", 6379, 3000, "redis");

        Jedis jedis = null;

        try {
            // 从redis连接池中获取一个连接执行命令
            jedis = jedisPool.getResource();

            // ================================== 测试链接 ================================================
//            System.out.println(jedis.set("single", "zhuge"));
//            System.out.println(jedis.get("single"));


            // ================================== 管道示例 ================================================
            // 管道的命令执行方式：cat redis.txt | redis-cli -h 127.0.0.1 -a password - p 6379 --pipe
//            Pipeline p1 = jedis.pipelined();
//
//            for (int i = 0; i < 10; i++) {
//                p1.incr("pipelineKey");
//                p1.set("zhuge"+i, "zhuge");
//            }
//
//
//            List<Object> results = p1.syncAndReturnAll();
//            System.out.println(results);

            // ================================== lua 脚本示例 ================================================
            // lua 脚本模拟一个商品减库存的原子操作
            // lua 脚本命令执行方式: redis-cli --eval /tmp/test.lua , 10
            // 初始化商品 10016 的库存
            jedis.set("product_count_10016", "15");

            String script = " local count = redis.call('get',KEYS[1])" +
                    " local a = tonumber(count) " +
                    " local b = tonumber(ARGV[1]) " +
                    " if a >= b then " +
                    " redis.call('set',KEYS[1],a-b) "+
                    " return 1 " +
                    " end " +
                    " return 0 ";

            Object obj = jedis.eval(script, Arrays.asList("product_count_10016"), Arrays.asList("10"));
            System.out.println(obj);
        }catch (Exception e) {
            e.printStackTrace();
        }finally {
            // 注意这里不是关闭连接，在JedisPool模式下，Jedis会被归还给资源池
            if (jedis != null) {
                jedis.close();
            }
        }
    }
}

顺带讲下redis管道与调用lua脚本，代码示例上面已经给出：

2.2 管道（Pipeline）

客户端可以一次性发送多个请求而不用等待服务器的响应，待所有命令都发送完后再一次性读取服务的响应，这样可以极大的降低多条命令执行的网络传输开销，管道执行多条命令的网络开销实际上只相当于一次命令执行的网络开销。需要注意到是用pipeline方式打包命令发送，redis必须在处理完所有命令前先缓存起所有命令的处理结果。打包的命令越多，缓存消耗内存也越多。所以并不是打包的命令越多越好。pipeline中发送的每个command都会被server立即执行，如果执行失败，将会在此后的响应中得到信息；也就是pipeline并不是表达"所有command都一起成功"的语义，管道中前面命令失败，后面命令不会有影响，继续执行。

详细代码示例见上面jedis连接示例：

java 复制代码

            Pipeline p1 = jedis.pipelined();

            for (int i = 0; i < 10; i++) {
                p1.incr("pipelineKey");
                p1.set("zhuge"+i, "zhuge");
                // 模拟管道报错
                // p1.setbit("zhuge", -1, true);
            }
            
            List<Object> results = p1.syncAndReturnAll();
            System.out.println(results);

2.3 RedisLua脚本

Redis在2.6推出了脚本功能，允许开发者使用Lua语言编写脚本传到Redis中执行。使用脚本的好处如下:

1、减少网络开销 ：本来5次网络请求的操作，可以用一个请求完成，原先5次请求的逻辑放在redis服务器上完成。使用脚本，减少了网络往返时延。这点跟管道类似。

2、原子操作 ：Redis会将整个脚本作为一个整体执行，中间不会被其他命令插入。管道不是原子的，不过redis的批量操作命令(类似mset)是原子的。

3、替代redis的事务功能 ：redis自带的事务功能很鸡肋，报错不支持回滚，而redis的lua脚本几乎实现了常规的事务功能，支持报错回滚操作，官方推荐如果要使用redis的事务功能可以用redislua替代。官网文档上有这样一段话：

bash 复制代码

A Redis script is transactional by definition, so everything you can do with a Redis transaction, you can also do with a script,and usually the script will be both simpler and faster.

从Redis2.6.0版本开始，通过内置的Lua解释器，可以使用EVAL命令对Lua脚本进行求值。EVAL命令的格式如下：

bash 复制代码

EVAL script numkeys key [key ...] arg [arg ...]

script参数是一段Lua脚本程序，它会被运行在Redis服务器上下文中，这段脚本不必(也不应该)定义为一个Lua函数。numkeys参数用于指定键名参数的个数。键名参数key $key...$ 从EVAL的第三个参数开始算起，表示在脚本中所用到的那些Redis键(key)，这些键名参数可以在Lua中通过全局变量KEYS数组，用1为基址的形式访问(KEYS $1$ ，KEYS $2$ ，以此类推)。

在命令的最后，那些不是键名参数的附加参数arg $arg...$ ，可以在Lua中通过全局变量ARGV数组访问，访问的形式和KEYS变量类似(ARGV $1$ 、ARGV $2$ ，诸如此类)。例如

bash 复制代码

127.0.0.1:6379>eval "return {KEYS[1],KEYS[2],ARGV[1],ARGV[2]}" 2 key1 key2 first seco 
nd
1)"key1"
2)"key2"
3)"first"
4)"second"

其中"return{KEYS $1$ ,KEYS $2$ ,ARGV $1$ ,ARGV $2$ }"是被求值的Lua脚本，数字2指定了键名参数的数量，key1和key2是键名参数，分别使用KEYS $1$ 和KEYS $2$ 访问，而最后的first和second则是附加参数，可以通过ARGV $1$ 和ARGV $2$ 访问它们。在Lua脚本中，可以使用**redis.call()**函数来执行Redis命令Jedis调用示例详见上面jedis连接示例：

java 复制代码

// 初始化商品 10016 的库存
            jedis.set("product_count_10016", "15");

            String script = " local count = redis.call('get',KEYS[1])" +
                    " local a = tonumber(count) " +
                    " local b = tonumber(ARGV[1]) " +
                    " if a >= b then " +
                    " redis.call('set',KEYS[1],a-b) "+
                    " return 1 " +
                    " end " +
                    " return 0 ";

            Object obj = jedis.eval(script, Arrays.asList("product_count_10016"), Arrays.asList("10"));
            System.out.println(obj);

注意，不要在Lua脚本中出现死循环和耗时的运算，否则redis会阻塞，将不接受其他的命令，所以使用时要注意不能出现死循环、耗时的运算。redis是单进程、单线程执行脚本。管道不会阻塞redis。