Redis 底层对 String 的 3 个优化

Redis对 String 类型实现了很多优化,通过以下三个重要的优化点来解释:

1. 简单动态字符串(SDS)

Redis 的 String 类型内部采用简单动态字符串(SDS)来管理字符串。相比于 C 语言的原生字符串,SDS 有以下优势:

  • 能够动态地改变自己的长度,避免了不必要的内存分配和拷贝操作;
  • SDS 本身有一个长度属性,可以快速计算字符串的长度;
  • SDS 可以与 C 语言原生字符串互相转换,方便对 C 语言中一些函数的使用。

SDS 源码:

c 复制代码
struct sdshdr {
    int len;                // 字符串实际长度
    int free;               // 字符串剩余空间
    char buf[];             // 字符串数据
};

源码解释:redis 源码实现 sds 函数,定义了 SDS 的各种操作函数,例如 sdsnew() 函数用于新建 SDS 字符串,sdsempty() 函数用于初始化一个空 SDS 字符串等。

2. 共享字符串

当多个客户端传入相同的字符串参数时,Redis 会把相同字符串的内部指针指向同一内存地址,这些指针共享同一个字符串对象。这种优化可以减少内存占用,提高性能。

c 复制代码
robj *lookupShared(const char *s, size_t len) {
    dictEntry *de = dictFind(server.shared.dict,s);
    if (de) {
        robj *shared = dictGetVal(de);
        return shared;
    }

    robj *shared = createStringObject(s,len);
    dictAdd(server.shared.dict, s, shared);
    return shared;
}

robj *createShared(const char *ptr, size_t len) {
    robj *sobj = createObject(OBJ_STRING,sdsnewlen(ptr,len));
    sobj->encoding = OBJ_ENCODING_RAW; // 设置编码方式为RAW
    return sobj;
}

源码解释:这里有两个相关函数:lookupShared() 用于在 Redis 的共享字符串池中查找指定的字符串,如果字符串存在,则返回字符串对象;如果字符串不存在,则新建字符串对象并存储在共享字符串池中。createShared() 函数则是用于创建新的共享字符串对象。

3. 编码的优化

Redis 的 String 类型支持多种编码方式,如 INT、EMBSTR、RAW 等。根据不同的编码方式和数据类型,Redis 选择最适合的编码方式来储存数据,从而避免了冗余的存储空间。

c 复制代码
int encodingType(robj *o) {
    if (o->encoding == OBJ_ENCODING_INT) {
        return OBJ_ENCODING_INT;
    } else if (o->encoding == OBJ_ENCODING_EMBSTR) {
        return OBJ_ENCODING_EMBSTR;
    } else {
        return OBJ_ENCODING_RAW;
    }
}

void setStringObject(robj *o, const char *s, size_t len) {
    if (o->encoding == OBJ_ENCODING_INT) {
        // 释放原有的整数值空间
        decrRefCount(o);
        // 创建新的Raw编码字符串对象
        o = createStringObject(s,len);
    } else if (o->encoding == OBJ_ENCODING_EMBSTR) {
        // 释放原有的Embstr编码字符串空间
        sdsfree(o->ptr);
        o->ptr = zmalloc(len);
        memcpy(o->ptr, s, len);
        o->encoding = OBJ_ENCODING_RAW;
    } else {
        // 设置Raw编码字符串值
        o->ptr = sdscpylen(o->ptr, s, len);
        o->encoding = OBJ_ENCODING_RAW;
    }
}

源码解释:这里有两个相关函数:encodingType() 用于返回某个值采用的编码方式,可以检查一个字符串对象或列表对象采用的编码方式;另一个函数 setStringObject() 用于设置一个字符串对象的值,根据需要选择适当的编码方式。

4. 总结时刻

回答出来以上三点,表明你对 Redis 的 String 类型的源码是有研究的,而不是每天只顾 CRUD,只顾写业务。

另外,也能表明你的技术深度,面试官一定会对你另眼相看哟!加油!

相关推荐
程序员清风10 分钟前
阿里二面:Kafka 消费者消费消息慢(10 多分钟),会对 Kafka 有什么影响?
java·后端·面试
幼稚园的山代王11 分钟前
Prompt Enginering(提示工程)先进技术
java·人工智能·ai·chatgpt·langchain·prompt
周某某~20 分钟前
二.单例模式‌
java·单例模式·设计模式
摸鱼仙人~23 分钟前
深入理解Java单例模式:确保类只有一个实例
java·javascript·单例模式
hstar952738 分钟前
三十五、面向对象底层逻辑-Spring MVC中AbstractXlsxStreamingView的设计
java·后端·spring·设计模式·架构·mvc
pengyu1 小时前
【Java设计原则与模式之系统化精讲:壹】 | 编程世界的道与术(实战指导篇)
java·后端·设计模式
日月星辰Ace1 小时前
JVM 垃圾回收简介
java
掉头发的王富贵1 小时前
Arthas神器入门:动态调试Java应用,轻松搞定生产环境Bug!
java·后端·debug
Java陈序员1 小时前
再见 Navicat!一款开源的 Web 数据库管理工具!
java·react.js·docker
知其然亦知其所以然2 小时前
RAG 结果太水?用 RRF + Reranker 重排,效果翻倍提升!
java·后端·llm