- Redis有哪些数据类型?底层实现分别是什么
Redis数据类型概述
Redis作为一款键值存储系统,提供了丰富多样的数据类型以满足不同场景的需求。以下是Redis支持的主要数据类型及其基本用途:
String(字符串)
存储单个键值对,支持增删改查、自增、截取等操作。
应用场景:计数器、缓存、分布式锁等。
底层实现:Redis字符串是动态字符串(SDS),其内部结构包含长度、已用长度和字节数组。
编码方式:Redis对字符串值的存储采用多种编码,如:
REDIS_ENCODING_INT:当值为整数且在一定范围内时,直接存储整数值,节省空间。
REDIS_ENCODING_EMBSTR:对于短字符串,使用embstr编码,将字符串与结构体紧凑存储在同一块连续内存中,减少内存分配次数。
REDIS_ENCODING_RAW:长字符串或非整数值使用raw编码,即传统的简单动态字符串。
List(列表)
有序的字符串列表,支持两端插入、弹出、范围查询等操作。
应用场景:消息队列、最新N个元素列表等。
底层实现:列表有两种编码方式,分别是:
ziplist(压缩列表):对于元素数量少且元素长度较短的列表,使用连续内存存储,节省空间。
linkedlist(双端链表):当列表元素数量或长度超过一定阈值时,转为双端链表实现,保证操作的高效性。
Set(集合)
无序的字符串集合,不允许重复成员,支持添加、删除、成员关系判断等操作。
应用场景:标签系统、唯一性检查、交并差集运算等。
底层实现:集合也有两种编码:
intset(整数集合):当集合中所有元素都是整数且范围适当时,使用整数集合存储,空间效率高。
hashtable(哈希表):当集合包含非整数元素或元素数量超过一定阈值时,转化为哈希表实现,提供快速的增删查操作。
Sorted Set(有序集合)
类似集合,但每个成员附带一个分数,依据分数进行排序。
支持添加、删除、按分数范围查询、排名、聚合操作等。
应用场景:排行榜、带权重的标签系统、Top N查询等。
底层实现:有序集合基于ziplist或skiplist(跳跃表)编码:
ziplist:小型有序集合,使用压缩列表存储,元素按分数排序。
skiplist:大型有序集合,使用跳跃表实现,提供O(log N)的插入、删除、查找等操作,同时保留了集合成员的顺序。
Hash(哈希)
键值对的集合,每个键值对由field-value组成。
支持增删改查单个field,批量操作整个哈希。
应用场景:对象属性存储、购物车等。
底层实现:哈希同样存在两种编码:
ziplist:对于小规模哈希(字段数量和值长度较小),使用压缩列表存储,紧凑且高效。
hashtable:当哈希的字段数量或值长度超过阈值时,转化为哈希表实现,提供快速的字段查找和更新。
Bitmaps(位图)
功能:Bitmaps允许以位(bit)为单位存储数据,非常适合用来表示稀疏的二进制状态,如用户签到、统计用户行为等。
应用案例:用户签到系统
假设有一个网站需要记录用户每天的签到情况。对于每个用户,我们可以使用一个唯一的用户ID作为键名,用Bitmaps来表示其连续365天的签到状态。每天签到时,使用SETBIT命令将对应日期的位设置为1。查询用户在过去一周是否有连续签到,则可通过BITCOUNT命令计算过去7天的位图中值为1的位数。
底层实现:在Redis中,位图实际上是基于字符串(String)类型实现的,每个字节(8位)对应字符串中的一个字符。通过对字符串执行位操作命令(如SETBIT, GETBIT, BITCOUNT, BITOP等),可以高效地进行位的增删查改。
HyperLogLog
功能:HyperLogLog是一种概率数据结构,用于估算集合中不重复元素(基数)的大致数量,而不需要存储所有元素。它以极小的空间开销(通常几百字节)提供接近精确的计数,适用于大规模唯一计数场景,如网站独立访客统计、唯一事件计数等。
应用案例:网站独立访客统计
在一个网站中,需要统计每天访问的独立访客数,但不想为每个访客保存完整的访问记录。可以为每天创建一个HyperLogLog键,每当有新的访客访问时,将其唯一标识符(如IP地址或用户代理字符串的哈希值)添加到当天的HyperLogLog中。使用PFADD命令添加元素,PFCOUNT命令获取估计的独立访客数。
底层实现:HyperLogLog使用特定的哈希函数和概率算法估计基数,不直接存储元素,而是维护一个内部状态来近似计数。
Geospatial Indexes(地理位置索引)
功能:Redis提供了对地理位置数据的支持,可以存储经纬度坐标,并进行距离查询、范围查询(如"附近的人"功能)、地理围栏(如"在某区域内的人")等操作。
应用案例:"附近的人"功能
在社交应用中,用户可以查看当前位置附近的其他在线用户。为每个用户存储其经纬度坐标,使用GEOADD命令将用户位置添加到地理位置索引中。当查询时,使用GEORADIUS或GEORADIUSBYMEMBER命令查找指定半径内的其他用户。
底层实现:使用有序集合(Sorted Set)存储地理位置数据,成员为地理位置的标识符,分值为经过特定公式转换后的经纬度坐标,以此实现空间索引。
Streams(流)
功能:Redis Streams是一种用于存储和处理时间序列数据的数据结构,特别适用于构建消息队列、活动日志、审计跟踪等应用场景。它支持多消费者消费同一数据流的不同部分,并具备消息持久化、消息ID生成、消息分片(Consumer Group)等功能。
应用案例:订单事件日志
在电商系统中,使用Redis Stream记录订单相关的事件,如订单创建、支付成功、发货等。每个事件作为一个消息,包含事件类型、发生时间、订单ID等信息。消费者(如后台任务、实时分析服务)通过XREAD或XREADGROUP命令订阅并处理这些事件。
底层实现:Stream数据结构在内部以键值对的形式存储,键为Stream的名字,值为一个特殊的字典结构,包含多个消息列表(每个消息列表代表一个分片)以及相关元数据。
如果大家需要视频版本的讲解,欢迎关注我的B站: