Redis篇-11--数据结构篇3--字符串内存模型(简单动态字符串SDS)

Redis 5 中的基础数据类型包括字符串(String)、列表(List)、集合(Set)、有序集合(Sorted Set)和哈希(Hash)。每种数据类型的底层结构和优化机制都经过了精心设计,以确保在不同场景下的高效性能。
主要概括如下:

本篇介绍下字符串的内存模型结构。

字符串(String)

1、SDS(简单动态字符串)

SDS (Simple Dynamic String):Redis使用自己的动态字符串SDS(简单动态字符串)来存储字符串数据。与 C 语言中的传统字符串不同,SDS提供了更高效的内存管理和操作。

  • 预分配空间:当字符串增长时,Redis会预先分配额外的空间,减少频繁的内存重分配。
  • 惰性释放:当字符串缩短时,Redis不会立即回收多余的空间,而是保留下来用于后续可能的增长。
  • 二进制安全:SDS是二进制安全的,可以存储任意数据,而不仅仅是文本。

2、SDS与C语言字符串对比

C语言有处理字符串方法的。而Redis就是C语言实现的,那为什么还搞一个SDS出来呢?我们从以下几点来看:

(1)、字符串长度处理
  • C语言的字符串存储方式如上图,想要获取字符串Redis的长度,需要从头开始遍历,直到遇到'\0'为止。

如上图,Redis在存储字符串时,是采用SDS(简单动态字符串)实现,其主要结构包含free、len、buf[]三个部分。

  • free记录空闲空间的长度。
  • len记录字符串长度(即buf中使用空间的长度)。
  • buf[]存储实际的字符串内容
    所以在Redis在存储字符串后,就已经记录了字符串的长度。当想要获取字符串长度时,只需要获取len即可,而无需在遍历字符串计算。前者遍历的时间复杂度为 O(n),Redis中O(1)就能拿到,速度明显提升。
(2)、内存重新分配

1、C语言中,修改字符串的时候会重新分配内存。修改地越频繁,内存分配也就越频繁。而内存分配是会消耗性能的,那么性能必然会下降。

2、Redis中实现了对字符串扩容的两种优化策略:(SDS这里可简单理解为字符串)
(1)、空间预分配

  • 对SDS修改及空间扩充时,除了分配所必须的空间外,还会额外分配未使用的空间。
  • 具体分配规则:SDS修改后,len长度小于1M,那么将会额外分配与len相同长度的未使用空间。如果修改后长度大于1M,那么将分配1M的额外使用空间。但需要注意的是字符串最大长度为 512M;

(2)、惰性空间释放

当然,有空间分配对应的就有空间释放。

  • SDS缩短时,并不会回收多余的内存空间,而是使用 free字段将多出来的空间记录下来。如果后续有变更操作,可直接使用free中记录的空间,减少了内存的重新分配消耗。

(3)、二进制安全

Redis可以存储各种数据类型,那么二进制数据肯定也不例外。但二进制数据并不是规则的字符串格式,可能会包含一些特殊的字符,比如'\0'等。
说明:

在 C 语言中,传统的字符串是以空字符\0作为终止符的。这意味着如果你要存储包含\0的二进制数据(例如图像、音频文件等),C 语言的字符串处理函数会错误地认为遇到\0就是字符串的结束,从而导致数据截断或解析错误。

SDS不依赖空字符\0来表示字符串的结束,会保存下全部的数据。相反,SDS使用len字段来记录字符串的实际长度,计算时不会因为遇到\0结束,会走到最后统计长度。无论buf中是否包含\0,SDS都可以通过len准确地知道字符串的长度,而不会误将\0作为字符串的结束标志。

因此,SDS 可以安全地存储和处理任意的二进制数据,而不会因为数据中包含\0而出现问题。

学海无涯苦作舟!!!

相关推荐
PD我是你的真爱粉5 分钟前
FastAPI使用tortoiseORM
数据库·fastapi
剩下了什么7 小时前
MySQL JSON_SET() 函数
数据库·mysql·json
山峰哥8 小时前
数据库工程与SQL调优——从索引策略到查询优化的深度实践
数据库·sql·性能优化·编辑器
较劲男子汉8 小时前
CANN Runtime零拷贝传输技术源码实战 彻底打通Host与Device的数据传输壁垒
运维·服务器·数据库·cann
java搬砖工-苤-初心不变8 小时前
MySQL 主从复制配置完全指南:从原理到实践
数据库·mysql
Yvonne爱编码9 小时前
JAVA数据结构 DAY6-栈和队列
java·开发语言·数据结构·python
熬夜有啥好9 小时前
数据结构——哈希表
数据结构·散列表
山岚的运维笔记10 小时前
SQL Server笔记 -- 第18章:Views
数据库·笔记·sql·microsoft·sqlserver
我能坚持多久11 小时前
【初阶数据结构01】——顺序表专题
数据结构
roman_日积跬步-终至千里11 小时前
【LangGraph4j】LangGraph4j 核心概念与图编排原理
java·服务器·数据库