Redis篇1——Redis深度剖析:从 5 种对象到 6 大底层结构

做后端开发这么久,Redis 肯定没少用。但你有没有想过,当我们敲下 SET name "Redis" 或者 ZADD rank 100 "Player1" 时,内存里到底发生了什么?

很多人会问:"Redis 底层是用 C 语言写的吗?"

答案是肯定的:是的,Redis 是由 C 语言编写的。正因为 C 语言可以直接操作内存,Redis 才能在性能上做到如此极致。

但有意思的是,Redis 并没有直接使用 C 语言自带的字符串或链表,而是自己造了一套轮子。这就引出了另一个核心概念:Redis 的"两层皮"架构

今天我们就来聊聊 Redis 的 5 种外层数据类型 到底是如何映射到 6 种底层数据结构 上的。


一、 为什么要有"两层皮"?

我们在写代码时,操作的是 Redis 对象(Object),也就是大家熟知的:String、List、Hash、Set、ZSet。

但在 Redis 内部,它并不会傻乎乎地只用一种方式存数据。它非常"鸡贼"(聪明),遵循一个核心原则:

数据少时,死抠内存(用紧凑型结构);数据多时,追求速度(用索引型结构)。

所以,理解 Redis 的关键,不在于死记硬背,而在于理解这种动态切换 的逻辑。我们将底层的核心结构归纳为 6 种(如果不算被淘汰的,主要就是这 6 大金刚)。


二、 6 大底层数据结构详解

1. SDS:简单动态字符串 (Simple Dynamic String)

  • 这是什么:它是 String 类型的基石。

  • 为什么要造轮子 :C 语言原本的字符串(以 \0 结尾)有两个大毛病:一是获取长度要遍历,慢;二是容易缓冲区溢出,不安全。

  • 长什么样:

    你就把它想象成一个带计数器的数组。
    Plaintext

    cpp 复制代码
    [ len: 5 | free: 2 | buf: "Redis\0.." ]

    它记录了当前长度 len,所以获取长度是 O(1) 的;而且它预分配了空间,防止频繁申请内存。

2. IntSet:整数集合

  • 这是什么 :当你用 SADD 往 Set 里只存整数,且数量不多时,Redis 会用这个。

  • 长什么样:

    这就是一个排序好的整数数组。
    Plaintext

    cpp 复制代码
    [1, 5, 9, 12, 20]

    因为是有序的,查找时使用二分查找,虽然比哈希表慢一点点,但非常非常省内存,因为没有指针开销。

3. Dict:字典 (哈希表)

  • 这是什么:这是 Redis 的骨架。Hash、Set、ZSet 的大数据存储都靠它。

  • 长什么样:

    标准的 数组 + 链表 结构,用来解决哈希冲突。

  • 它的绝活:渐进式 Rehash。

    它内部有两个哈希表 ht[0] 和 ht[1]。当需要扩容时,它不会一次性把所有数据搬过去(那样会卡死主线程),而是每次增删改查时顺手搬一点,后台再搬一点,不知不觉就完成了扩容。

4. ZipList / Listpack:压缩列表 / 紧凑列表

  • 这是什么:这是 Redis 省内存的神器。

  • 长什么样:

    别被"列表"两个字骗了,它在物理内存上其实是一整块连续的内存条(像数组)。
    Plaintext

    cpp 复制代码
    [总长度|尾偏移|元素1|元素2|元素3|结尾]

    它没有指针(指针在 64 位系统很占地),而是直接挨着存数据。

  • 重要更新

    • ZipList:老版本用的,有个致命缺陷叫"连锁更新"(改一个元素长度,后面全得跟着改)。

    • Listpack :Redis 7.0 引入的接班人。结构类似,但去掉了导致连锁更新的字段。现在新版 Redis 里的 Hash 和 ZSet 小数据底层都换成这个了。

5. QuickList:快速列表

  • 这是什么:List(列表)对象的专用底层。

  • 长什么样:

    它是"链表"和"压缩列表"的混血儿。

    普通的链表指针太多太费内存,ZipList 太长了插入又慢。QuickList 就在中间取了个平衡:

    宏观上是一个双向链表,但链表的每个节点里,存的不是一个数据,而是一整块 ZipList/Listpack。

6. SkipList:跳表

  • 这是什么:ZSet(有序集合)的灵魂。

  • 长什么样:

    你可以把它理解为**"多层级的高速公路"**。

    普通链表查找要从头遍历。跳表在链表上面加了几层索引(Level)。

    • L3: 1 -> 50 -> 100

    • L2: 1 -> 10 -> 20 -> ... -> 50

    • L1: 1 -> 2 -> 3 -> ...

      查找时,先走上层大步跳跃,快到了再下层精细查找。效率直逼二叉树,但实现简单得多。


三、 终极映射:对象 vs 结构

了解了这 6 大结构,我们最后把它们和 5 大对象对应起来,这就是面试的满分答案

如果你用这个命令... 数据少/小时 (省内存) 数据多/大时 (高性能)
String (SET) int (纯数字) SDS
List (LPUSH) QuickList QuickList
Hash (HSET) Listpack (旧:ZipList) Dict
Set (SADD) IntSet Dict
ZSet (ZADD) Listpack (旧:ZipList) Dict + SkipList

总结一下

Redis 的设计哲学其实就两句话:

  1. 能省则省:数据少的时候,用连续内存(Listpack, IntSet),没有指针开销。

  2. 该快则快:数据多的时候,上重型索引(Dict, SkipList),保证高并发下的响应速度。

搞懂了这 6 种结构和这种动态切换的逻辑,Redis 的底层对你来说就是透明的了。

相关推荐
HelloWorld__K3 小时前
整合阿里云短信服务
数据库·阿里云·云计算
lytao1233 小时前
离线安装MongoDB集群
数据库·mongodb
Ralph_Y3 小时前
C++数据库操作
开发语言·数据库·c++
Access开发易登软件3 小时前
Access 数据可视化:如何制作箱形图
前端·数据库·vba·access·access开发
醉风塘4 小时前
MongoDB内嵌文档深度解析:使用MongoTemplate进行高效操作
数据库·mongodb
电商API_180079052474 小时前
淘宝商品数据爬虫技术实践指南
大数据·数据库·人工智能·爬虫
酸菜牛肉汤面4 小时前
17、什么是脏读?幻读?不可重复读?
java·数据库·mysql
ClouGence4 小时前
数据实时迁移同步工具 CloudCanal-v5.3.1.0 发布,支持金仓数据库
大数据·数据库·mysql·数据分析·dba
怪我冷i4 小时前
GORM 的 Migration API
数据库·postgresql·golang·ai编程·ai写作
Miss_Chenzr4 小时前
Springboot快递信息管理52c05本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
java·数据库·spring boot