Redis篇-11--数据结构篇3--字符串内存模型(简单动态字符串SDS)

Redis 5 中的基础数据类型包括字符串(String)、列表(List)、集合(Set)、有序集合(Sorted Set)和哈希(Hash)。每种数据类型的底层结构和优化机制都经过了精心设计,以确保在不同场景下的高效性能。
主要概括如下:

本篇介绍下字符串的内存模型结构。

字符串(String)

1、SDS(简单动态字符串)

SDS (Simple Dynamic String):Redis使用自己的动态字符串SDS(简单动态字符串)来存储字符串数据。与 C 语言中的传统字符串不同,SDS提供了更高效的内存管理和操作。

  • 预分配空间:当字符串增长时,Redis会预先分配额外的空间,减少频繁的内存重分配。
  • 惰性释放:当字符串缩短时,Redis不会立即回收多余的空间,而是保留下来用于后续可能的增长。
  • 二进制安全:SDS是二进制安全的,可以存储任意数据,而不仅仅是文本。

2、SDS与C语言字符串对比

C语言有处理字符串方法的。而Redis就是C语言实现的,那为什么还搞一个SDS出来呢?我们从以下几点来看:

(1)、字符串长度处理
  • C语言的字符串存储方式如上图,想要获取字符串Redis的长度,需要从头开始遍历,直到遇到'\0'为止。

如上图,Redis在存储字符串时,是采用SDS(简单动态字符串)实现,其主要结构包含free、len、buf\[\]三个部分。

  • free记录空闲空间的长度。
  • len记录字符串长度(即buf中使用空间的长度)。
  • buf\[\]存储实际的字符串内容
    所以在Redis在存储字符串后,就已经记录了字符串的长度。当想要获取字符串长度时,只需要获取len即可,而无需在遍历字符串计算。前者遍历的时间复杂度为 O(n),Redis中O(1)就能拿到,速度明显提升。
(2)、内存重新分配

1、C语言中,修改字符串的时候会重新分配内存。修改地越频繁,内存分配也就越频繁。而内存分配是会消耗性能的,那么性能必然会下降。

2、Redis中实现了对字符串扩容的两种优化策略:(SDS这里可简单理解为字符串)
(1)、空间预分配

  • 对SDS修改及空间扩充时,除了分配所必须的空间外,还会额外分配未使用的空间。
  • 具体分配规则:SDS修改后,len长度小于1M,那么将会额外分配与len相同长度的未使用空间。如果修改后长度大于1M,那么将分配1M的额外使用空间。但需要注意的是字符串最大长度为 512M;

(2)、惰性空间释放

当然,有空间分配对应的就有空间释放。

  • SDS缩短时,并不会回收多余的内存空间,而是使用 free字段将多出来的空间记录下来。如果后续有变更操作,可直接使用free中记录的空间,减少了内存的重新分配消耗。

(3)、二进制安全

Redis可以存储各种数据类型,那么二进制数据肯定也不例外。但二进制数据并不是规则的字符串格式,可能会包含一些特殊的字符,比如'\0'等。
说明:

在 C 语言中,传统的字符串是以空字符\0作为终止符的。这意味着如果你要存储包含\0的二进制数据(例如图像、音频文件等),C 语言的字符串处理函数会错误地认为遇到\0就是字符串的结束,从而导致数据截断或解析错误。

SDS不依赖空字符\0来表示字符串的结束,会保存下全部的数据。相反,SDS使用len字段来记录字符串的实际长度,计算时不会因为遇到\0结束,会走到最后统计长度。无论buf中是否包含\0,SDS都可以通过len准确地知道字符串的长度,而不会误将\0作为字符串的结束标志。

因此,SDS 可以安全地存储和处理任意的二进制数据,而不会因为数据中包含\0而出现问题。

学海无涯苦作舟!!!

相关推荐
SelectDB14 小时前
阶跃星辰基于 SelectDB 构建 PB 级 Agent 可观测平台
大数据·数据库·aigc
这个DBA有点耶15 小时前
GROUP BY优化全解:如何写出既不丢数据又飞快的分组查询
数据库·mysql·架构
掉头发的王富贵18 小时前
【StarRocks】极限十分钟入门StarRocks
数据库·sql·mysql
Nturmoils18 小时前
WHERE 条件别凭习惯写,常用查询先跑一遍
数据库
刘马想放假20 小时前
Modbus 全栈技术解析:TCP、RTU、ASCII、RTU over TCP
数据结构·网络协议
云技纵横21 小时前
一个 @Async 让循环依赖暴雷:Spring 代理的暗坑
redis
Databend2 天前
在 AWS 中国峰会逛了一天,我在 Databend 展台看到了 Agent 数据基础设施的新思路
数据库·人工智能·agent
犯困蛋挞yy2 天前
用Claude快速解决Redis代码报错反复无解的问题
redis
北域码匠2 天前
冒泡排序太慢?鸡尾酒排序双向优化,原生 C# 零第三方库完整代码
数据结构·排序算法·泛型·c# 算法·鸡尾酒排序·原生 c# 开发·冒泡排序优化·嵌入式算法
ClouGence3 天前
Oracle 数据同步为什么会出现数据不一致?长事务是常被忽略的原因
数据库·后端·oracle