Redis 5 中的基础数据类型包括字符串(String)、列表(List)、集合(Set)、有序集合(Sorted Set)和哈希(Hash)。每种数据类型的底层结构和优化机制都经过了精心设计,以确保在不同场景下的高效性能。
主要概括如下:
本篇介绍下字符串的内存模型结构。
字符串(String)
1、SDS(简单动态字符串)
SDS (Simple Dynamic String):Redis使用自己的动态字符串SDS(简单动态字符串)来存储字符串数据。与 C 语言中的传统字符串不同,SDS提供了更高效的内存管理和操作。
- 预分配空间:当字符串增长时,Redis会预先分配额外的空间,减少频繁的内存重分配。
- 惰性释放:当字符串缩短时,Redis不会立即回收多余的空间,而是保留下来用于后续可能的增长。
- 二进制安全:SDS是二进制安全的,可以存储任意数据,而不仅仅是文本。
2、SDS与C语言字符串对比
C语言有处理字符串方法的。而Redis就是C语言实现的,那为什么还搞一个SDS出来呢?我们从以下几点来看:
(1)、字符串长度处理
- C语言的字符串存储方式如上图,想要获取字符串Redis的长度,需要从头开始遍历,直到遇到'\0'为止。
如上图,Redis在存储字符串时,是采用SDS(简单动态字符串)实现,其主要结构包含free、len、buf[]三个部分。
- free记录空闲空间的长度。
- len记录字符串长度(即buf中使用空间的长度)。
- buf[]存储实际的字符串内容
所以在Redis在存储字符串后,就已经记录了字符串的长度。当想要获取字符串长度时,只需要获取len即可,而无需在遍历字符串计算。前者遍历的时间复杂度为 O(n),Redis中O(1)就能拿到,速度明显提升。
(2)、内存重新分配
1、C语言中,修改字符串的时候会重新分配内存。修改地越频繁,内存分配也就越频繁。而内存分配是会消耗性能的,那么性能必然会下降。
2、Redis中实现了对字符串扩容的两种优化策略:(SDS这里可简单理解为字符串)
(1)、空间预分配
- 对SDS修改及空间扩充时,除了分配所必须的空间外,还会额外分配未使用的空间。
- 具体分配规则:SDS修改后,len长度小于1M,那么将会额外分配与len相同长度的未使用空间。如果修改后长度大于1M,那么将分配1M的额外使用空间。但需要注意的是字符串最大长度为 512M;
(2)、惰性空间释放
当然,有空间分配对应的就有空间释放。
- SDS缩短时,并不会回收多余的内存空间,而是使用 free字段将多出来的空间记录下来。如果后续有变更操作,可直接使用free中记录的空间,减少了内存的重新分配消耗。
(3)、二进制安全
Redis可以存储各种数据类型,那么二进制数据肯定也不例外。但二进制数据并不是规则的字符串格式,可能会包含一些特殊的字符,比如'\0'等。
说明:
在 C 语言中,传统的字符串是以空字符\0
作为终止符的。这意味着如果你要存储包含\0
的二进制数据(例如图像、音频文件等),C 语言的字符串处理函数会错误地认为遇到\0
就是字符串的结束,从而导致数据截断或解析错误。
SDS不依赖空字符\0
来表示字符串的结束,会保存下全部的数据。相反,SDS使用len
字段来记录字符串的实际长度,计算时不会因为遇到\0
结束,会走到最后统计长度。无论buf
中是否包含\0
,SDS都可以通过len
准确地知道字符串的长度,而不会误将\0
作为字符串的结束标志。
因此,SDS 可以安全地存储和处理任意的二进制数据,而不会因为数据中包含\0
而出现问题。
学海无涯苦作舟!!!