Redis 底层对 String 的 3 个优化

Redis对 String 类型实现了很多优化,通过以下三个重要的优化点来解释:

1. 简单动态字符串(SDS)

Redis 的 String 类型内部采用简单动态字符串(SDS)来管理字符串。相比于 C 语言的原生字符串,SDS 有以下优势:

  • 能够动态地改变自己的长度,避免了不必要的内存分配和拷贝操作;
  • SDS 本身有一个长度属性,可以快速计算字符串的长度;
  • SDS 可以与 C 语言原生字符串互相转换,方便对 C 语言中一些函数的使用。

SDS 源码:

c 复制代码
struct sdshdr {
    int len;                // 字符串实际长度
    int free;               // 字符串剩余空间
    char buf[];             // 字符串数据
};

源码解释:redis 源码实现 sds 函数,定义了 SDS 的各种操作函数,例如 sdsnew() 函数用于新建 SDS 字符串,sdsempty() 函数用于初始化一个空 SDS 字符串等。

2. 共享字符串

当多个客户端传入相同的字符串参数时,Redis 会把相同字符串的内部指针指向同一内存地址,这些指针共享同一个字符串对象。这种优化可以减少内存占用,提高性能。

c 复制代码
robj *lookupShared(const char *s, size_t len) {
    dictEntry *de = dictFind(server.shared.dict,s);
    if (de) {
        robj *shared = dictGetVal(de);
        return shared;
    }

    robj *shared = createStringObject(s,len);
    dictAdd(server.shared.dict, s, shared);
    return shared;
}

robj *createShared(const char *ptr, size_t len) {
    robj *sobj = createObject(OBJ_STRING,sdsnewlen(ptr,len));
    sobj->encoding = OBJ_ENCODING_RAW; // 设置编码方式为RAW
    return sobj;
}

源码解释:这里有两个相关函数:lookupShared() 用于在 Redis 的共享字符串池中查找指定的字符串,如果字符串存在,则返回字符串对象;如果字符串不存在,则新建字符串对象并存储在共享字符串池中。createShared() 函数则是用于创建新的共享字符串对象。

3. 编码的优化

Redis 的 String 类型支持多种编码方式,如 INT、EMBSTR、RAW 等。根据不同的编码方式和数据类型,Redis 选择最适合的编码方式来储存数据,从而避免了冗余的存储空间。

c 复制代码
int encodingType(robj *o) {
    if (o->encoding == OBJ_ENCODING_INT) {
        return OBJ_ENCODING_INT;
    } else if (o->encoding == OBJ_ENCODING_EMBSTR) {
        return OBJ_ENCODING_EMBSTR;
    } else {
        return OBJ_ENCODING_RAW;
    }
}

void setStringObject(robj *o, const char *s, size_t len) {
    if (o->encoding == OBJ_ENCODING_INT) {
        // 释放原有的整数值空间
        decrRefCount(o);
        // 创建新的Raw编码字符串对象
        o = createStringObject(s,len);
    } else if (o->encoding == OBJ_ENCODING_EMBSTR) {
        // 释放原有的Embstr编码字符串空间
        sdsfree(o->ptr);
        o->ptr = zmalloc(len);
        memcpy(o->ptr, s, len);
        o->encoding = OBJ_ENCODING_RAW;
    } else {
        // 设置Raw编码字符串值
        o->ptr = sdscpylen(o->ptr, s, len);
        o->encoding = OBJ_ENCODING_RAW;
    }
}

源码解释:这里有两个相关函数:encodingType() 用于返回某个值采用的编码方式,可以检查一个字符串对象或列表对象采用的编码方式;另一个函数 setStringObject() 用于设置一个字符串对象的值,根据需要选择适当的编码方式。

4. 总结时刻

回答出来以上三点,表明你对 Redis 的 String 类型的源码是有研究的,而不是每天只顾 CRUD,只顾写业务。

另外,也能表明你的技术深度,面试官一定会对你另眼相看哟!加油!

相关推荐
Elastic 中国社区官方博客38 分钟前
Elasticsearch 推理 API 增加了开放的可定制服务
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
南囝coding42 分钟前
Claude Code 插件系统来了
前端·后端·程序员
oak隔壁找我1 小时前
Java 语言教程
后端
nzxzn1 小时前
MYSQL第二次作业
数据库·mysql
考虑考虑2 小时前
JDK25中的StableValue
java·后端·java ee
核桃杏仁粉2 小时前
excel拼接数据库
数据库·oracle·excel
TiAmo zhang2 小时前
SQL Server 2019实验 │ 设计数据库的完整性
数据库·sqlserver
superlls2 小时前
(定时任务)接上篇:定时任务的分布式执行与分布式锁使用场景
java·分布式·后端
子沫20202 小时前
springboot中server.main.web-application-type=reactive导致的拦截器不生效
java·spring boot·后端
mortimer2 小时前
Python 进阶:彻底理解类属性、类方法与静态方法
后端·python