【Redis-05】Redis如何实现保存键值对的保存及过期键的管理策略

在之前的文章我们介绍过,Redis服务器在启动之初,会初始化RedisServer的实例,在这个实例中存在很多重要的属性结构,同理本篇博客中介绍的数据库实现原理也会和其中的某些属性相关,我们继续看一下吧。

1.服务器和客户端实现的数据库

Redis服务器在启动时,会根据redis.conf文件的中databases xx这个配置决定创建多少个数据库(默认配置是16),启动后默认使用的0号数据库,当然可以使用select dbnum这个命令来切换。需要注意的是在redis集群模式下,只有0号数据库可以用,是无法切换到其他库的。

Redis服务器会将所有的数据库都保存在服务器状态的redisServer的db数组中,数组的每一项都代表了一个数据库,用redisDb结构来表示。首先看一下redisServer.db的源码:

c 复制代码
struct redisServer {
	...
	// 代表数据库的数组
    redisDb *db;
    // 这个记录的配置文件中数据库的数量
	int dbnum;  
    ...
}

我们通过客户端向Redis写入的任何数据都会记录到这个db数组中,根据前面描述,我们知道可以通过select命令切换到另一个目标数据库,但是客户端是怎么记录的它当前操作的哪个数据库呢?我们继续看一下源码:

c 复制代码
typedef struct client {
    ...
    // 指针指向当前客户端正在操作的数据库
    redisDb *db;            /* Pointer to currently SELECTed DB. */
	...
} client;

看,在client客户端状态中,有一个db指针,指向了server.db数组中的某一项,代表了当前客户端正在操作的数据库。所以通过切换client.db的指针,调整客户端操作的数据库,这就是select命令的实现原理。

2.数据库字典的实现

Redis是支持key-value键值对存储的,这其实是通过dict结构来实现的,在前面讲到的内容中,服务器和客户端都指向了一个redisDb的结构,在这个db结构中,就包含存储了键值对的字典结构,首先看一下源码:

c 复制代码
typedef struct redisDb {
	...
	// 这个存放的就是键值对
    dict *dict;                 /* The keyspace for this DB */
    // 这个存放的是键值对的过期时间,下面一节会说到
    dict *expires;              /* Timeout of keys with a timeout set */
    ...
} redisDb;

dict这个指针就指向了存储键值对的字典结构,key是字符串robj类型,value可以是任何的robj类型。当我们分别新增、删除、更新或者查询的时候,其实就是根据输入的key在这个字典上做curd的操作。我们在Redis写入两个键值对,图示如下:

除了对数据库键值对的curd操作,基于整个数据操作的一些命令也是在这个dict上面实现的,比如清空所有键值对的flushdb,或者exists、del、dbsize命令等。在执行命令前后,redis还会执行一些其他操作,比如检查是否超出最大内存,更新lru时间,记录慢查询日志,或者向monitor客户端发送命令等等,这就是redis数据字典的实现原理。

3.键值对的生命周期管理

这里说的生命周期,其实就是指键值对的过期时间。通常我们使用expire key这个命令设置键的过期时间,但其实Redis是有四个命令支持设置过期时间的:

  • expire key seconds 将key的生命周期设置为second秒;
  • pexpire key milliseconds 将key的生命周期设置为milliseconds毫秒;
  • expireat key timestamp 将key的过期时间设置在timestamp这个秒的时间戳过期;
  • pexpireat key timestamp 将key的过期时间设置在timestamp这个毫秒的时间戳过期;

值得说明的是,虽然有这么多命令支持设置过期时间,但是最终经过转换都是指向pexpireat这一个命令来实现。现在的问题是,这么多键值对的过期时间,在redis服务端是怎么保存和维护的呢,我们继续往下看。

前面在看redisDb源码的时候,有一个expires属性,我们再把源码拿过来看一下:

c 复制代码
typedef struct redisDb {
	...
    // 这个存放的是键的过期时间
    dict *expires;              /* Timeout of keys with a timeout set */
    ...
} redisDb;

这就很清晰了,通过expires这个指针,指向了一个dict结构,字典中记录的就是所有键值对的过期时间。其中,key是键值对的键,value是long类型的毫秒精度的unix时间戳,即过期的时间点。值得注意的是,保存键值对的dict字典和保存过期时间的expires字典,key指针都指向相同的一个键字符串对象,所以在内存空间上是不会存在浪费的。

除此之外,跟过期时间操作相关的两个命令,当然也是基于expires这个字典来实现的:

  • ttl 返回键值对的剩余时间
  • persist删除键值对的过期时间

4.过期键的管理策略

既然有过期时间,那么键值对过期之后,是不是立即被删除了呢?答案肯定不是,redis通过惰性删除和定期删除两种策略实现对过期键的管理:

  • 惰性删除策略:当程序访问到某个键值对的时候,会对过期时间检查,如果过期就删除,否则不处理。
  • 定期删除策略:基于serverCron时间事件函数,从一定数量的数据库中取出一定数量的随机键进行检查,并删除其中过期的键值对。

使用这两种过期键管理策略可以最大程度上在合理使用CPU时间和避免浪费内存空间之间取得平衡。

5.持久化对过期键的处理

  • rdb 持久化
    • save或者bgsave会检查键的过期时间,已过期的键不会保存到的持久化的rdb文件中。
    • 服务器启动载入rdb文件时,如果是主服务器,过期键会被忽略加载;如果是从服务器,不论是否过期,都会被加载。
  • aof 持久化
    • 写入aof文件时,key是会写入的,过期之后,通过追加del命令,才会显示的删除此过期键。
    • bgrewriteaof 重写时会检查键的过期时间,已过期的键不会写入新的aof文件中。
    • 服务器启动载入aof文件时,过期键也会被忽略,不会被加载。

6.主从复制对过期键的处理

主从复制,为了保证数据的一致性,通常由主服务器执行更新的操作,然后将命令发送给从服务器。在3.2版本之前,由于惰性删除策略的存在,主服务器遇到对过期键的访问,会删除此键值对,并给客户端返回null值,但是从服务器由于不能执行删除操作,即便是此键已过期,也会返回对应的value值,出现数据不一致导致的脏读问题。

在3.2版本之后,这个问题得到了修改,从服务器会判断当前键是否过期,如果已过期并且是从服务器的话,也会返回null值。

相关推荐
o(╥﹏╥)16 分钟前
linux(ubuntu )卡死怎么强制重启
linux·数据库·ubuntu·系统安全
阿里嘎多学长31 分钟前
docker怎么部署高斯数据库
运维·数据库·docker·容器
Yuan_o_33 分钟前
Linux 基本使用和程序部署
java·linux·运维·服务器·数据库·后端
Sunyanhui138 分钟前
牛客网 SQL36查找后排序
数据库·sql·mysql
老王笔记1 小时前
MHA binlog server
数据库·mysql
lovelin+v175030409662 小时前
安全性升级:API接口在零信任架构下的安全防护策略
大数据·数据库·人工智能·爬虫·数据分析
DT辰白2 小时前
基于Redis的网关鉴权方案与性能优化
数据库·redis·缓存
2401_871213302 小时前
mysql高阶语句
数据库·mysql
zxrhhm2 小时前
PostgreSQL的交互式终端使用一系列命令来获取有关文本搜索配置对象的信息
数据库·postgresql