Redis是一个开源的、使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。Redis凭借其高性能、高可用性、丰富的数据结构以及简洁的API而备受青睐。其中,跳跃表(SkipList)作为Redis中的一种重要数据结构,被广泛用于有序集合(Sorted Set)的底层实现,以支持高效的插入、删除和查找操作。
什么是跳跃表(SkipList)
跳跃表(SkipList)是一种用于有序 元素序列快速搜索 的随机化的数据结构,由美国计算机科学家William Pugh于1989年在其论文《Skip lists: a probabilistic alternative to balanced trees》中提出。它通过在每个节点中维持多个指向其他节点的指针,以达到快速访问节点的目的。跳跃表可以看作是对单链表的一种优化,通过添加多级索引来提高查找效率。
跳跃表的基本结构
跳跃表是一个包含多个节点和层级信息的结构体。每个节点都包含多个层,每一层都构成了一个有序链表。查找时,从最高层开始,根据目标值的大小逐层向下查找,直到找到目标节点或确定目标节点不存在。
跳跃表节点(zskiplistNode):
跳跃表的节点结构通常包含以下信息:
- 成员对象(ele):存储节点的元素值。
- 分数(score):用于排序和比较的元素分数,确保有序性。
- 后退指针(backward):指向前一个节点的指针,便于反向遍历。
- 层级数组(level):一个柔性数组,每个元素都是一个结构体,包含指向同一层次和下一层次节点的指针(forward)和跨度(span)。
跳跃表(zskiplist):
包含多个节点和层级信息的结构体,通常还包含表头节点(header)、表尾节点(tail)以及最大层级(level)等信息。表头节点和表尾节点用于快速定位跳跃表的边界,而最大层级则决定了跳跃表的高度。
跳跃表的优势
- 查找效率高:对于包含n个节点的跳跃表,其查找操作的时间复杂度为O(log n),这是因为每次查找都可以跳过部分节点,从而减少比较次数。
- 实现简单:与平衡树相比,跳跃表的实现更加简单直观,插入和删除操作只需要修改相邻节点的指针,不涉及复杂的子树调整。
- 空间换时间:通过增加数据冗余(即多层索引),跳跃表实现了查找效率的显著提升。
Redis中的跳跃表实现
Redis中的跳跃表主要用于有序集合(Sorted Set)的底层实现。有序集合是一种元素不重复且按照成员分数进行排序的集合。Redis使用跳跃表来维护有序集合中的元素顺序,以便实现高效的插入、删除和查找操作。
Redis跳跃表节点的C语言结构体定义:
c
typedef struct zskiplistNode {
sds ele; // 节点元素
double score; // 节点分数
struct zskiplistNode *backward; // 回退指针
// 层级数组,level 数组中的每个元素都包含两个指针:forward 和 span
struct zskiplistLevel {
struct zskiplistNode *forward;
unsigned int span;
} level[];
} zskiplistNode;
跳跃表操作的详细代码示例:
以下是一个简化的Redis跳跃表插入操作的C语言代码示例。这个示例主要展示了如何创建新的节点、计算新节点的层级、更新跳跃表以及处理插入过程中的一些细节。
c
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
// 假设一些基础函数已经定义,如zslRandomLevel(), zslCreateNode()等
// 插入新元素到跳跃表
int zslInsert(zskiplist *zsl, double score, sds ele) {
zskiplistNode *update[ZSKIPLIST_MAXLEVEL], *x;
int rank[ZSKIPLIST_MAXLEVEL];
int i, level;
// 更新update数组和rank数组
// 省略具体实现,这里只展示框架
level = zslRandomLevel();
if (level > zsl->level) {
for (i = zsl->level; i < level; i++) {
rank[i] = 0;
update[i] = zsl->header;
update[i]->level[i].span = zsl->length;
}
zsl->level = level;
}
x = zslCreateNode(level, score, ele);
// 遍历每一层,更新指针和跨度
for (i = 0; i < level; i++) {
x->level[i].forward = update[i]->level[i].forward;
update[i]->level[i].forward = x;
// 更新跨度
x->level[i].span = update[i]->level[i].span - (rank[0] - rank[i]);
update[i]->level[i].span = (rank[0] - rank[i]) + 1;
}
// 设置后退指针
x->backward = (rank[0] == 0) ? NULL : update[0];
if (x->level[0].forward != NULL) {
x->level[0].forward->backward = x;
} else {
zsl->tail = x;
}
// 更新跳跃表的长度
zsl->length++;
// 返回新插入节点的排名(通常为0,因为是从头开始插入)
return 0;
}
// 辅助函数:随机生成节点层级
int zslRandomLevel(void) {
int level = 1;
while ((random() & 0xFFFF) < (ZSKIPLIST_P * 0xFFFF))
level += 1;
return (level < ZSKIPLIST_MAXLEVEL) ? level : ZSKIPLIST_MAXLEVEL;
}
// 辅助函数:创建新节点
zskiplistNode *zslCreateNode(int level, double score, sds ele) {
zskiplistNode *zn = zmalloc(sizeof(*zn) + level * sizeof(struct zskiplistLevel));
zn->score = score;
zn->ele = ele;
for (int i = 0; i < level; i++) {
zn->level[i].forward = NULL;
zn->level[i].span = 0;
}
zn->backward = NULL;
return zn;
}
// 假设的跳跃表结构体定义
typedef struct zskiplist {
struct zskiplistNode *header, *tail;
unsigned long length;
int level;
} zskiplist;
// 初始化跳跃表
zskiplist *zslCreate(void) {
int j;
zskiplist *zsl;
zsl = zmalloc(sizeof(*zsl));
zsl->header = zslCreateNode(ZSKIPLIST_MAXLEVEL, 0, NULL);
for (j = 0; j < ZSKIPLIST_MAXLEVEL; j++) {
zsl->header->level[j].forward = NULL;
zsl->header->level[j].span = 0;
}
zsl->header->backward = NULL;
zsl->tail = NULL;
zsl->length = 0;
zsl->level = 1;
return zsl;
}
// 假设的常量定义
#define ZSKIPLIST_MAXLEVEL 32 /* Should be enough for 2^32 elements */
#define ZSKIPLIST_P 0.25 /* Skiplist P = 1/4 */
// 示例使用
int main() {
zskiplist *zsl = zslCreate();
sds ele1 = sdsnew("one");
sds ele2 = sdsnew("two");
zslInsert(zsl, 1.0, ele1);
zslInsert(zsl, 2.0, ele2);
// 假设有额外的函数来遍历和打印跳跃表
// printSkipList(zsl);
// 清理资源
// 省略具体的资源释放代码
return 0;
}
注意:上述代码是一个简化的示例,用于说明如何在Redis的上下文中实现跳跃表的插入操作。在实际Redis实现中,跳跃表的操作会更加复杂,包括更详细的错误处理、内存管理以及与其他Redis数据结构的交互等。
此外,Redis的跳跃表实现还包含删除和查找等操作,这些操作同样基于节点的层级和跨度信息来实现高效的遍历和更新。
最后,虽然上述代码使用了C语言的标准库函数(如random()
, malloc()
, free()
等),但在Redis的实际实现中,它使用了一套自定义的内存分配和错误处理机制,以确保高效和稳定的运行。