redis原理之底层数据结构-跳表

1.什么是跳表

1.1 链表及其不足

链表是在程序设计中最常见的数据结构之一,它通过指针将多个链表节点连接起来,这样就可以将逻辑上同一类的数据存储到不连续的内存空间上。链表结构如下:

但是链表有一个问题,就是当链表需要查询一个元素的时候,需要从链表头部开始遍历,时间复杂度为o(n)。

2.1 跳表的诞生

针对查询链表的时间复杂度为o(n)的问题,我们可以学习B+树,给链表加上索引,采用二分查找的思想查找元素。但是二分查找是有一个前提,就是要求元素是有序的,所以我们在插入元素的时候,维护好节点的顺序。

如果元素过多,我们还可以给目录增加目录:

所以跳表由如下几部分组成。

头节点

层级:每个节点可以增加多个节点,这个曾经在跳表中一般是随机增加的,主要是为了增加搜索的速度,最多可以有32个层级。

尾节点:一般是空

所以跳表在查找元素target的时候,首先从最高层目录开始遍历,找到第一个大于target的元素e,证明target元素一定在e的左边。

2.redis对跳表的实现

redis中跳表定义的结构如下:

cpp 复制代码
typedef struct zskiplistNode {
    //跳表存储的元素
    sds ele;
    //跳表存储的分数
    double score;
    //指向上一个节点的前向指针,方便从后向前遍历
    struct zskiplistNode *backward;
    //后向指针,是一个包含0-32的指针数组
    struct zskiplistLevel {
        //后向指针
        struct zskiplistNode *forward;
        //跨度
        unsigned long span;
    } level[];
} zskiplistNode;

typedef struct zskiplist {
    //跳表头节点
    struct zskiplistNode *header, *tail;
    //跳表的节点个数
    unsigned long length;
    //跳表的最大等级为多少
    int level;
} zskiplist;

可以看出redis为了结局自身结构的问题,增加了以下两个特性:

1.redis为了解决从尾部遍历元素的需求,所以在调表的节点之间加上了一个后向指针。

2.为了解决查询某个元素rank的需求,在不同层级节点之间维护了跨度。

所以redis的跳表结构如下

3.红黑树、跳表、B+树的区别以及使用场景

3.1 红黑树

红黑树,查询时间为o(logn)在插入元素的时候,需要通过自旋或者染色等操作来维持树结构的平衡,所以插入的时候相对耗时,并且插入元素可能影响的节点比较多。java中Map的为了解决hash冲突以及linux中对epoll的实现采用了红黑树。

3.2 B+树

B+树,紧凑,适合磁盘存储。b+树相当于一个节点拥有多个子节点,每个节点能够存储多个键值对。在查询数据的时候,能够减少磁盘随机IO的次数。但是b+树插入数据的时候,

需要进行页分裂等操作,所以插入相对耗时。mysql的底层就采用B+树存储。

3.3 跳表

跳表,适合内存存储。跳表的目录层级可能很高,但是查询也是o(log(n))的时间复杂度,而且跳表插入速度快,适合内存存储。这也是为什么redis选择跳表存储的原因。

相关推荐
小安运维日记1 小时前
Linux云计算 |【第四阶段】NOSQL-DAY1
linux·运维·redis·sql·云计算·nosql
X同学的开始1 小时前
数据结构之二叉树遍历
数据结构
kejijianwen2 小时前
JdbcTemplate常用方法一览AG网页参数绑定与数据寻址实操
服务器·数据库·oracle
编程零零七2 小时前
Python数据分析工具(三):pymssql的用法
开发语言·前端·数据库·python·oracle·数据分析·pymssql
AIAdvocate4 小时前
Pandas_数据结构详解
数据结构·python·pandas
jiao000015 小时前
数据结构——队列
c语言·数据结构·算法
kaneki_lh5 小时前
数据结构 - 栈
数据结构
铁匠匠匠5 小时前
从零开始学数据结构系列之第六章《排序简介》
c语言·数据结构·经验分享·笔记·学习·开源·课程设计
C-SDN花园GGbond5 小时前
【探索数据结构与算法】插入排序:原理、实现与分析(图文详解)
c语言·开发语言·数据结构·排序算法
高兴就好(石5 小时前
DB-GPT部署和试用
数据库·gpt