Redis中String数据结构为什么以长度44为embstr和raw实现的分界线?

​ 一道常见Redis面试题。

​ 在Redis的String数据结构中,当字符串的实际长度小于44且包含非整数字符时底层编码方式为embstr。当超过44时使用raw底层编码方式。

​ 那么为什么要以字符串的长度44为分界线呢?

信息一

​ 首先要分析embstr和raw编码格式的区别:首先Redis中所有的数据结构都是通过redisObject结构体描述的,其中的type字段标识了当前对象使用的数据结构(string、list、set等),encoding字段标识了当前对象采用的编码方式(ziplist、listpack、intset、skiplist等)。而embstr编码方式是为了提高cpu寻址效率在redisObject之后直接存储具体字符串的数据内容。而raw是在redisObject上通过维护一个指向堆上的内存空间存储具体的字符串内容。

信息二

​ 内存分配器都是按照2^n进行分配的,同时cpu cache line最小访问单位为64个字节。因此为了实现cpu高效寻址,64个字节的内存空间是一个阈值。而Redis中操作对象的单位是通过redisObject。

分析如下

​ redisObject的数据结构如下:

cpp 复制代码
#define LRU_BITS 24
typedef struct redisObject {
    unsigned type:4;
    unsigned encoding:4;
    unsigned lru:LRU_BITS; /* LRU time (relative to global lru_clock) or
                            * LFU data (least significant 8 bits frequency
                            * and most significant 16 bits access time). */
    int refcount;
    void *ptr;
} robj;

​ type字段占用4个bit位,encoding占用4个bit位,LRU_BITS为24, lru字段占用24个bit位即3个字节。refcount字段占用4个字节。ptr字段在64位系统下,占用8个字节。加在一起 1 + 3 + 4 + 8 = 16个字节。即redisObject结构体中需要占用16个字节。

​ 而ptr字段具体指向了实际的string编码结构对象,即sds。sds的结构有sds8、sds16、sds32、sds64。此时最大的寻址空间才为64个字节,因此选用最小的sds8即可。

​ sds8数据结构如下:

cpp 复制代码
struct __attribute__ ((__packed__)) sdshdr8 {
    uint8_t len; /* used */
    uint8_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};

​ len字段和alloc字段为uint8_t,占用1个字节,flags占用1个字节。总计1 + 1 + 1 = 3个字节。

​ 此时总计描述一个字符串信息需要使用的头信息占用16 + 3 = 19个字节。而string数据结构在设计上是兼容C语言字符串的。因此需要在末尾加上'\0'字符。还需要占用1个字节。此时总计19 + 1 = 20个字节。

​ 64 - 20 = 44个字节。因此当字符串长度小于44个字节长度时,使用embstr编码类型可以极大提高redis的查询效率和存储效率。所以string数据结构使用字符串长度为44作为embstr和raw编码类型的分界线。

更多资料:0voice · GitHub

相关推荐
一 乐6 小时前
婚纱摄影网站|基于ssm + vue婚纱摄影网站系统(源码+数据库+文档)
前端·javascript·数据库·vue.js·spring boot·后端
1.14(java)7 小时前
SQL数据库操作:从CRUD到高级查询
数据库
Full Stack Developme8 小时前
数据库索引的原理及类型和应用场景
数据库
乌萨奇也要立志学C++8 小时前
【洛谷】递归初阶 三道经典递归算法题(汉诺塔 / 占卜 DIY/FBI 树)详解
数据结构·c++·算法
鱼跃鹰飞9 小时前
Leetcode1891:割绳子
数据结构·算法
IDC02_FEIYA10 小时前
SQL Server 2025数据库安装图文教程(附SQL Server2025数据库下载安装包)
数据库·windows
辞砚技术录10 小时前
MySQL面试题——联合索引
数据库·面试
萧曵 丶10 小时前
MySQL 主键不推荐使用 UUID 的深层原因
数据库·mysql·索引
小北方城市网10 小时前
分布式锁实战指南:从选型到落地,避开 90% 的坑
java·数据库·redis·分布式·python·缓存
毕设十刻10 小时前
基于Vue的人事管理系统67zzz(程序 + 源码 + 数据库 + 调试部署 + 开发环境配置),配套论文文档字数达万字以上,文末可获取,系统界面展示置于文末
前端·数据库·vue.js