Redis五大数据类型的底层设计

SDS

无论是 Redis 的 Key 还是 Value，其基础数据类型都是字符串。
虽然 Redis是使用标准 C 语言开发的，但并没有直接使用 C 语言中传统的字符串表示，而是自定义了一种字符串。这种字符串本身的结构比较简单，但功能却非常强大，称为简单动态字符串，Simple Dynamic String，简称 SDS。

SDS 结构

SDS 不同于 C 字符串。C 字符串本身是一个以双引号括起来，以空字符'\0'结尾的字符序列。但 SDS 是一个结构体，定义在 Redis 安装目录下的 src/sds.h 中：

java 复制代码

struct sdshdr { 
// 字节数组，用于保存字符串 
char buf[]; 
// buf[]中已使用字节数量，称为 SDS 的长度 
int len; 
// buf[]中尚未使用的字节数量 
int free; 
}

通过以上结构可以看出，SDS 的 buf 值实际是一个 C 字符串，包含空字符'\0'共占 6 个字节 。**但 SDS 的 len 是不包含空字符'\0'的。

SDS 的优势

对于 C 字符串，若要获取其长度，则必须要通过遍历整个字符串 才可获取到的。对于超长字符串的遍历，会成为系统的性能瓶颈。 SDS 结构体中直接就存放着字符串的长度数据
SDS 采用了空间预分配策略 与惰性空间释放策略来避免内存再分配问题。
空间预分配策略是指，每次 SDS 进行空间扩展时，程序不但为其分配所需的空间，还会为其分配**额外的未使用空间，以减少内存再分配次数。**而额外分配的未使用空间大小取决于空间扩展后 SDS 的 len 属性值。
- 如果 len 属性值**小于 1M，**那么分配的未使用空间 free 的大小与 len 属性值相同。
- 如果 len 属性值大于等于 1M ，那么分配的未使用空间 free 的大小固定是 1M。
SDS 对于空间释放采用的是惰性空间释放策略。
- 该策略是指，SDS 字符串长度如果缩短，那么多出的未使用空间将暂时不释放，而是增加到 free 中。以使后期扩展 SDS 时减少内存再分配次数。如果要释放 SDS 的未使用空间，则可通过 sdsRemoveFreeSpace()函数来释放。

集合的底层实现原理

Redis 中对于 Set 类型 的底层实现，直接采用了 hashTable。hashtable就是普通的哈希表（key为set的值，value为null）。
但对于 Hash、ZSet、List 集合的底层实现进行了特殊的设计，使其保证了 Redis 的高性能。

1 两种实现的选择

对于Hash与ZSet 集合，其底层的实现实际有两种：压缩列表zipList，与跳跃列表skipList。
这两种实现对于用户来说是透明的，但用户写入不同的数据，系统会自动使用不同的实现。只有同时满足以配置文件 redis.conf 中相关集合元素数量阈值与元素大小阈值两个条件****，使用的就是压缩列表 zipList，只要有一个条件不满足使用的就是跳跃列表 skipList。、
例如，对于ZSet 集合中这两个条件如下：
- 集合元素个数小于 redis.conf 中 zset-max-ziplist-entries 属性的值，其默认值为 128
- 每个集合元素大小都小于 redis.conf 中 zset-max-ziplist-value 属性的值，其默认值为 64字节

2什么是 zipList

zipList，通常称为压缩列表，是一个经过特殊编码的用于存储字符串或整数的双向链表。 其底层数据结构由三部分构成：**head、entries 与 end。**这三部分在内存上是连续存放的。

prevlength：该部分用于记录上一个 entry 的长度，以实现逆序遍历。
encoding：该部分用于标志后面的 data 的具体类型 。如果 data 为整数类型，encoding固定长度为 1 字节 。如果 data 为字符串类型，则 encoding 长度可能会是 1 字节、2 字节或 5 字节 。data 字符串不同的长度，对应着不同的 encoding 长度。（压缩的体现）。

什么是** skipList

skipList，跳跃列表，简称跳表，是一种**随机化的数据结构，基于并联的链表，**实现简单，查找效率较高。简单来说跳表也是链表的一种，只不过它在链表的基础上增加了跳跃功能。也正是这个跳跃功能，使得在查找元素时，能够提供较高的效率。

skipList 原理

假设有一个带头尾结点的有序链表。

为了提升查找效率，在偶数结点上增加一个指针，让其指向下一个偶数结点。

这样所有偶数结点就连成了一个新的链表（简称高层链表），当然，高层链表包含的节点个数只是原来链表的一半。此时再想查找某个数据时，先沿着高层链表进行查找。当遇到第一个比待查数据大的节点时，立即从该大节点的前一个节点回到原链表中进行查找。

问题：这种对链表分层级的方式从原理上看确实提升了查找效率，但在实际操作时就出现了问题：由于固定序号的元素拥有固定层级 ，所以列表元素出现增加或删除的情况下，会导致列表整体元素层级大调整 ，但这样势必会大大降低系统性能。

优化

为了避免前面的问题，skipList 采用了随机分配层级方式 。即在确定了总层级后，每添加一个新的元素时会自动为其随机分配一个层级。这种随机性就解决了节点序号与层级间的固定关系问题。

上图演示了列表在生成过程中为每个元素随机分配层级的过程。从这个 skiplist 的创建和插入过程可以看出，每一个节点的层级数都是随机分配的，而且新插入一个节点不会影响到其它节点的层级数。
只需要**修改插入节点前后的指针，**而不需对很多节点都进行调整。这就降低了插入操作的复杂度。

什么是 quickList

List的底层实现： quickList，快速列表，quickList 本身是一个双向无循环链表 ，它的每一个节点都是一个zipList。
quickList 本质上是 zipList 和 linkedList 的混合体 。其将 linkedList 按段切分，每一段使用 zipList 来紧凑存储若干真正的数据元素，多个 zipList 之间使用双向指针串接起来。当然，对于每个 zipList 中最多可存放多大容量的数据元素，在配置文件中通过 list-max-ziplist-size属性可以指定。