Redis07 - Redis底层数据结构

Redis底层数据结构

文章目录

Redis底层数据结构
- 一：对象机制详解
- [二：SDS 简单动态字符串](#二：SDS 简单动态字符串)
- 三：压缩列表
- - - zipList结构
- 四：跳表

一：对象机制详解

String类型 - 简单动态字符串SDS
List类型 - 双向链表 & 压缩列表
Set类型 - 哈希表和整数数组
zset类型 - 压缩列表和跳表
hash类型 - 压缩列表和哈希表

二：SDS 简单动态字符串

Redis 是用 C 语言写的，但是对于Redis的字符串，却不是 C 语言中的字符串（即以空字符\0结尾的字符数组）

它是自己构建了一种名为简单动态字符串（simple dynamic string,SDS）的抽象类型，并将 SDS 作为 Redis的默认字符串表示。

用于存储二进制数据的一种结构，具有动态扩容的特点，实现位于src/sds.h和sds.c中

sdshdr就是头部，buf是实际存储数据的地方，这个数据结构除了存储二进制数据之外，还能存储对应的字符串，在buf中，用户数据的后面总是跟着一个\0，数据 + \0 = buf

SDS 有五种不同的头部. 其中sdshdr5实际并未使用到. 所以实际上有四种不同的头部

len 保存了SDS保存字符串的长度
buf[] 数组用来保存字符串的每个元素
alloc分别以uint8, uint16, uint32, uint64表示整个SDS, 除过头部与末尾的\0, 剩余的字节数.
flags 始终为一字节, 以低三位标示着头部的类型, 高5位未使用

一般来说，SDS 除了保存数据库中的字符串值以外，SDS 还可以作为缓冲区（buffer）：包括 AOF 模块中的 AOF 缓冲区以及客户端状态中的输入缓冲区

三：压缩列表

zipList结构

是为了提高效率而设计的一种特殊编码的双向链表，可以存储字符串或者整数

存储整数的时候是采用整数的二进制而不是字符串的方式

能在O(1)的时间中完成list的push和pop相关的操作

因为每一次的操作都要重新分配ziplist的内存，所以实际的时间复杂度和ziplist的内存使用量相关

zlbytes字段的类型是uint32_t, 这个字段中存储的是整个ziplist所占用的内存的字节数
zltail字段的类型是uint32_t, 它指的是ziplist中最后一个entry的偏移量. 用于快速定位最后一个entry, 以快速完成pop等操作
zllen字段的类型是uint16_t, 它指的是整个ziplit中entry的数量。这个值只占2bytes（16位）:
- 如果ziplist中entry的数目小于65535(2¹⁶), 那么该字段中存储的就是实际entry的值
- 若等于或超过65535, 那么该字段的值固定为65535
- 但实际数量需要一个个entry的去遍历所有entry才能得到
zlend是一个终止字节, 其值为0xff. ziplist保证任何情况下, 一个entry的首字节都不会是255

四：跳表

跳表结构在 Redis 中的运用场景只有一个，那就是作为有序列表 (Zset) 的使用。

跳跃表的性能可以保证在查找，删除，添加等操作的时候在对数期望时间内完成，但是缺点就会比较耗费内存的空间，跳表是典型的时间换空间的应用

cpp 复制代码

/* ZSETs use a specialized version of Skiplists */
typedef struct zskiplistNode {
    sds ele; // 数据
    double score; // 得分
    struct zskiplistNode *backward; // 指针指向结点的前一个紧邻结点
    struct zskiplistLevel {
        struct zskiplistNode *forward; // 指向比自己得分高的某个结点
        unsigned int span; // forward字段指向的结点, 距离当前结点的距离
    } level[];
} zskiplistNode;

typedef struct zskiplist {
    struct zskiplistNode *header, *tail;
    unsigned long length;
    int level;
} zskiplist;

设计核心

头节点不持有任何数据, 且其level[]的长度为32

每个结点

ele字段，持有数据，是sds类型
score字段, 其标示着结点的得分, 结点之间凭借得分来判断先后顺序, 跳跃表中的结点按结点的得分升序排列.
backward指针, 这是原版跳跃表中所没有的. 该指针指向结点的前一个紧邻结点.
level字段, 用以记录所有结点(除过头节点外)；每个结点中最多持有32个zskiplistLevel结构. 实际数量在结点创建时, 按幂次定律随机生成. 每个zskiplistLevel中有两个字段
- forward字段指向比自己得分高的某个结点(不一定是紧邻的), 并且, 若当前zskiplistLevel实例在level[]中的索引为X, 则其forward字段指向的结点, 其level[]字段的容量至少是X+1. 这也是上图中, 为什么forward指针总是画的水平的原因.
- span字段代表forward字段指向的结点, 距离当前结点的距离. 紧邻的两个结点之间的距离定义为1.