zset为什么要用到skiplist+Dict的数据结构

文章目录

      • [1. 为什么不能只用跳表(SkipList)?](#1. 为什么不能只用跳表(SkipList)?)
      • [2. 为什么不能只用字典(Dict)?](#2. 为什么不能只用字典(Dict)?)
      • [3. 联手的威力:1 + 1 > 2](#3. 联手的威力:1 + 1 > 2)
      • [4. 一个关键问题:会浪费两倍内存吗?](#4. 一个关键问题:会浪费两倍内存吗?)
      • [5. 补充:字典的维护(参考图片信息)](#5. 补充:字典的维护(参考图片信息))
      • 总结

这是一个非常精妙的设计。简单来说,Redis 在 zset 大量数据时同时采用 跳表(SkipList)字典(Dict) ,是为了实现 "全方位的性能无死角"

如果只用其中一个,zset 的某些常用操作就会变得非常慢。我们将它们这种组合称为"强强联手":

1. 为什么不能只用跳表(SkipList)?

跳表的主要优势在于有序性区间查询

  • 它的强项: 它可以以 O ( log ⁡ N ) O(\log N) O(logN) 的时间复杂度找到某个分值(Score)的起始位置,然后进行范围遍历(比如 ZRANGE)。
  • 它的弱点: 如果你想知道"成员 user_1 的分数是多少?"(ZSCORE 命令),跳表必须从顶层向下层层查找,复杂度是 O ( log ⁡ N ) O(\log N) O(logN)。

虽然 O ( log ⁡ N ) O(\log N) O(logN) 已经很快了,但 Redis 追求的是极致。

2. 为什么不能只用字典(Dict)?

字典(哈希表)的优势在于极速定位

  • 它的强项: 给它一个成员名,它能以 O ( 1 ) O(1) O(1) 的时间告诉你它的分数或是否存在。
  • 它的弱点: 字典是无序 的。如果你想执行"获取分数前 10 名"或者"获取分数在 100 到 200 之间的人",字典只能全表扫描并排序,复杂度高达 O ( N log ⁡ N ) O(N \log N) O(NlogN)。

3. 联手的威力:1 + 1 > 2

Redis 开发者将这两者结合起来,形成了一个复合结构:

操作类型 对应命令 使用的结构 复杂度
按成员找分数 ZSCORE Dict O ( 1 ) O(1) O(1)
判断成员是否存在 ZISMEMBER Dict O ( 1 ) O(1) O(1)
获取排名区间 ZRANGE SkipList O ( log ⁡ N + M ) O(\log N + M) O(logN+M)
按分数段查询 ZRANGEBYSCORE SkipList O ( log ⁡ N + M ) O(\log N + M) O(logN+M)

4. 一个关键问题:会浪费两倍内存吗?

你可能会担心:存两份数据,内存不就爆了吗?
并不会。

  • 指针共享: 实际上,成员字符串(Member String)在内存中只存了一份。
  • 跳表节点里的指针和字典里的指针,都指向同一个字符串对象的内存地址
  • 虽然跳表和字典本身会占用一些额外的索引空间(指针),但相比于实际存储的大量数据,这点开销换取性能的全方位提升是非常划算的。

5. 补充:字典的维护(参考图片信息)

正如你提供的图片 所示,zset 里的这个 Dict 也会经历 渐进式 rehash

  • zset 不断增大导致 Dict 需要扩容时,Redis 不会一次性搬迁,而是分多次完成。
  • 在 rehash 过程中,zset 的新增操作会直接写入新表 ht[1],这确保了 rehash 期间 zsetZSCORE 等操作依然能保持高效,且不会阻塞主线程。

总结

zset 选这种组合,是因为:

  1. Dict 保证了根据成员名查分数的 O ( 1 ) O(1) O(1) 性能。
  2. SkipList 保证了范围查询和排序的 O ( log ⁡ N ) O(\log N) O(logN) 性能。
  3. 通过 指针共享 解决了内存浪费问题。

这种"空间换时间"且"多索引指向同一数据"的思想,也是很多大型数据库(如 MySQL 的聚簇索引和二级索引)的核心设计逻辑。

相关推荐
编程之升级打怪5 小时前
KMP查询算法的匹配串的前缀后缀相同的最大长度
数据结构
没文化的阿浩6 小时前
【数据结构】排序(2)——直接选择排序、堆排序
数据结构·算法·排序算法
承渊政道7 小时前
【动态规划算法】(子数组系列问题建模与解题思路精讲)
数据结构·c++·学习·算法·leetcode·动态规划·哈希算法
冷小鱼7 小时前
数据结构:从“生活常识“到“工程实战“
数据结构
仍然.7 小时前
算法题目---哈希表
数据结构·散列表
Morwit7 小时前
【力扣hot100】 494. 目标和
数据结构·算法·leetcode
木木_王7 小时前
嵌入式Linux学习 | 数据结构 (Day03)顺序表与单链表 超详细解析(含 C 语言实现 + 作业 + 避坑指南)
linux·c语言·数据结构·学习
承渊政道8 小时前
【动态规划算法】(子序列问题解题框架与典型案例)
数据结构·c++·学习·算法·leetcode·macos·动态规划
m0_629494738 小时前
LeetCode 热题 100-----15.轮转数组
数据结构·算法·leetcode