Redis07 - Redis底层数据结构

Redis底层数据结构

文章目录

一:对象机制详解

  • String类型 - 简单动态字符串SDS
  • List类型 - 双向链表 & 压缩列表
  • Set类型 - 哈希表和整数数组
  • zset类型 - 压缩列表和跳表
  • hash类型 - 压缩列表和哈希表

二:SDS 简单动态字符串

Redis 是用 C 语言写的,但是对于Redis的字符串,却不是 C 语言中的字符串(即以空字符\0结尾的字符数组)

它是自己构建了一种名为简单动态字符串(simple dynamic string,SDS)的抽象类型,并将 SDS 作为 Redis的默认字符串表示。

用于存储二进制数据的一种结构,具有动态扩容的特点,实现位于src/sds.hsds.c

sdshdr就是头部,buf是实际存储数据的地方,这个数据结构除了存储二进制数据之外,还能存储对应的字符串,在buf中,用户数据的后面总是跟着一个\0数据 + \0 = buf


SDS 有五种不同的头部. 其中sdshdr5实际并未使用到. 所以实际上有四种不同的头部

  • len 保存了SDS保存字符串的长度
  • buf[] 数组用来保存字符串的每个元素
  • alloc分别以uint8, uint16, uint32, uint64表示整个SDS, 除过头部与末尾的\0, 剩余的字节数.
  • flags 始终为一字节, 以低三位标示着头部的类型, 高5位未使用

一般来说,SDS 除了保存数据库中的字符串值以外,SDS 还可以作为缓冲区(buffer):包括 AOF 模块中的 AOF 缓冲区以及客户端状态中的输入缓冲区

三:压缩列表

zipList结构

是为了提高效率而设计的一种特殊编码的双向链表,可以存储字符串或者整数

存储整数的时候是采用整数的二进制而不是字符串的方式

能在O(1)的时间中完成list的push和pop相关的操作

因为每一次的操作都要重新分配ziplist的内存,所以实际的时间复杂度和ziplist的内存使用量相关

  • zlbytes字段的类型是uint32_t, 这个字段中存储的是整个ziplist所占用的内存的字节数
  • zltail字段的类型是uint32_t, 它指的是ziplist中最后一个entry的偏移量. 用于快速定位最后一个entry, 以快速完成pop等操作
  • zllen字段的类型是uint16_t, 它指的是整个ziplit中entry的数量。这个值只占2bytes(16位):
    • 如果ziplist中entry的数目小于65535(2^16^), 那么该字段中存储的就是实际entry的值
    • 若等于或超过65535, 那么该字段的值固定为65535
    • 但实际数量需要一个个entry的去遍历所有entry才能得到
  • zlend是一个终止字节, 其值为0xff. ziplist保证任何情况下, 一个entry的首字节都不会是255

四:跳表

跳表结构在 Redis 中的运用场景只有一个,那就是作为有序列表 (Zset) 的使用。

跳跃表的性能可以保证在查找,删除,添加等操作的时候在对数期望时间内完成,但是缺点就会比较耗费内存的空间,跳表是典型的时间换空间的应用

cpp 复制代码
/* ZSETs use a specialized version of Skiplists */
typedef struct zskiplistNode {
    sds ele; // 数据
    double score; // 得分
    struct zskiplistNode *backward; // 指针指向结点的前一个紧邻结点
    struct zskiplistLevel {
        struct zskiplistNode *forward; // 指向比自己得分高的某个结点
        unsigned int span; // forward字段指向的结点, 距离当前结点的距离
    } level[];
} zskiplistNode;

typedef struct zskiplist {
    struct zskiplistNode *header, *tail;
    unsigned long length;
    int level;
} zskiplist;

设计核心

头节点不持有任何数据, 且其level[]的长度为32

每个结点

  • ele字段,持有数据,是sds类型
  • score字段, 其标示着结点的得分, 结点之间凭借得分来判断先后顺序, 跳跃表中的结点按结点的得分升序排列.
  • backward指针, 这是原版跳跃表中所没有的. 该指针指向结点的前一个紧邻结点.
  • level字段, 用以记录所有结点(除过头节点外);每个结点中最多持有32个zskiplistLevel结构. 实际数量在结点创建时, 按幂次定律随机生成. 每个zskiplistLevel中有两个字段
    • forward字段指向比自己得分高的某个结点(不一定是紧邻的), 并且, 若当前zskiplistLevel实例在level[]中的索引为X, 则其forward字段指向的结点, 其level[]字段的容量至少是X+1. 这也是上图中, 为什么forward指针总是画的水平的原因.
    • span字段代表forward字段指向的结点, 距离当前结点的距离. 紧邻的两个结点之间的距离定义为1.
相关推荐
小猪咪piggy2 分钟前
【数据结构】(8) 二叉树
数据结构
m0_519523105 分钟前
算法练习——哈希表
数据结构·c++·算法
奔波霸的伶俐虫40 分钟前
navicat导出表结构到Excel 带字段备注
数据库·oracle·excel
style-h1 小时前
数据结构 顺序表及其实现
数据结构
a_j581 小时前
算法与数据结构(合并两个有序数组)
数据结构·算法·leetcode
神经星星1 小时前
入选AAAI 2025!解决医学图像分割软边界与共现难题,中国地质大学等提出图像分割模型ConDSeg
数据库·人工智能·机器学习
喝醉酒的小白1 小时前
SQL Server:查看内存使用情况
数据库
开开又心心的学嵌入式2 小时前
数据结构——树
数据结构
C182981825752 小时前
算法-反转链表
数据结构·链表
_GR2 小时前
力扣刷题(数组篇)
数据结构·算法·leetcode