Java面试八股之Redis有哪些数据类型?底层实现分别是什么

  1. Redis有哪些数据类型?底层实现分别是什么

Redis数据类型概述

Redis作为一款键值存储系统,提供了丰富多样的数据类型以满足不同场景的需求。以下是Redis支持的主要数据类型及其基本用途:

String(字符串)

存储单个键值对,支持增删改查、自增、截取等操作。

应用场景:计数器、缓存、分布式锁等。

底层实现:Redis字符串是动态字符串(SDS),其内部结构包含长度、已用长度和字节数组。

编码方式:Redis对字符串值的存储采用多种编码,如:

REDIS_ENCODING_INT:当值为整数且在一定范围内时,直接存储整数值,节省空间。

REDIS_ENCODING_EMBSTR:对于短字符串,使用embstr编码,将字符串与结构体紧凑存储在同一块连续内存中,减少内存分配次数。

REDIS_ENCODING_RAW:长字符串或非整数值使用raw编码,即传统的简单动态字符串。

List(列表)

有序的字符串列表,支持两端插入、弹出、范围查询等操作。

应用场景:消息队列、最新N个元素列表等。

底层实现:列表有两种编码方式,分别是:

ziplist(压缩列表):对于元素数量少且元素长度较短的列表,使用连续内存存储,节省空间。

linkedlist(双端链表):当列表元素数量或长度超过一定阈值时,转为双端链表实现,保证操作的高效性。

Set(集合)

无序的字符串集合,不允许重复成员,支持添加、删除、成员关系判断等操作。

应用场景:标签系统、唯一性检查、交并差集运算等。

底层实现:集合也有两种编码:

intset(整数集合):当集合中所有元素都是整数且范围适当时,使用整数集合存储,空间效率高。

hashtable(哈希表):当集合包含非整数元素或元素数量超过一定阈值时,转化为哈希表实现,提供快速的增删查操作。

Sorted Set(有序集合)

类似集合,但每个成员附带一个分数,依据分数进行排序。

支持添加、删除、按分数范围查询、排名、聚合操作等。

应用场景:排行榜、带权重的标签系统、Top N查询等。

底层实现:有序集合基于ziplist或skiplist(跳跃表)编码:

ziplist:小型有序集合,使用压缩列表存储,元素按分数排序。

skiplist:大型有序集合,使用跳跃表实现,提供O(log N)的插入、删除、查找等操作,同时保留了集合成员的顺序。

Hash(哈希)

键值对的集合,每个键值对由field-value组成。

支持增删改查单个field,批量操作整个哈希。

应用场景:对象属性存储、购物车等。

底层实现:哈希同样存在两种编码:

ziplist:对于小规模哈希(字段数量和值长度较小),使用压缩列表存储,紧凑且高效。

hashtable:当哈希的字段数量或值长度超过阈值时,转化为哈希表实现,提供快速的字段查找和更新。

Bitmaps(位图)

功能:Bitmaps允许以位(bit)为单位存储数据,非常适合用来表示稀疏的二进制状态,如用户签到、统计用户行为等。

应用案例:用户签到系统

假设有一个网站需要记录用户每天的签到情况。对于每个用户,我们可以使用一个唯一的用户ID作为键名,用Bitmaps来表示其连续365天的签到状态。每天签到时,使用SETBIT命令将对应日期的位设置为1。查询用户在过去一周是否有连续签到,则可通过BITCOUNT命令计算过去7天的位图中值为1的位数。

底层实现:在Redis中,位图实际上是基于字符串(String)类型实现的,每个字节(8位)对应字符串中的一个字符。通过对字符串执行位操作命令(如SETBIT, GETBIT, BITCOUNT, BITOP等),可以高效地进行位的增删查改。

HyperLogLog

功能:HyperLogLog是一种概率数据结构,用于估算集合中不重复元素(基数)的大致数量,而不需要存储所有元素。它以极小的空间开销(通常几百字节)提供接近精确的计数,适用于大规模唯一计数场景,如网站独立访客统计、唯一事件计数等。

应用案例:网站独立访客统计

在一个网站中,需要统计每天访问的独立访客数,但不想为每个访客保存完整的访问记录。可以为每天创建一个HyperLogLog键,每当有新的访客访问时,将其唯一标识符(如IP地址或用户代理字符串的哈希值)添加到当天的HyperLogLog中。使用PFADD命令添加元素,PFCOUNT命令获取估计的独立访客数。

底层实现:HyperLogLog使用特定的哈希函数和概率算法估计基数,不直接存储元素,而是维护一个内部状态来近似计数。

Geospatial Indexes(地理位置索引)

功能:Redis提供了对地理位置数据的支持,可以存储经纬度坐标,并进行距离查询、范围查询(如"附近的人"功能)、地理围栏(如"在某区域内的人")等操作。

应用案例:"附近的人"功能

在社交应用中,用户可以查看当前位置附近的其他在线用户。为每个用户存储其经纬度坐标,使用GEOADD命令将用户位置添加到地理位置索引中。当查询时,使用GEORADIUS或GEORADIUSBYMEMBER命令查找指定半径内的其他用户。

底层实现:使用有序集合(Sorted Set)存储地理位置数据,成员为地理位置的标识符,分值为经过特定公式转换后的经纬度坐标,以此实现空间索引。

Streams(流)

功能:Redis Streams是一种用于存储和处理时间序列数据的数据结构,特别适用于构建消息队列、活动日志、审计跟踪等应用场景。它支持多消费者消费同一数据流的不同部分,并具备消息持久化、消息ID生成、消息分片(Consumer Group)等功能。

应用案例:订单事件日志

在电商系统中,使用Redis Stream记录订单相关的事件,如订单创建、支付成功、发货等。每个事件作为一个消息,包含事件类型、发生时间、订单ID等信息。消费者(如后台任务、实时分析服务)通过XREAD或XREADGROUP命令订阅并处理这些事件。

底层实现:Stream数据结构在内部以键值对的形式存储,键为Stream的名字,值为一个特殊的字典结构,包含多个消息列表(每个消息列表代表一个分片)以及相关元数据。

如果大家需要视频版本的讲解,欢迎关注我的B站:

相关推荐
lizi8888821 分钟前
单组件的编写
java
java_heartLake23 分钟前
设计模式之代理模式
java·设计模式·代理模式
魏 无羡1 小时前
pgsql 分组查询方法
java·服务器·数据库
兩尛1 小时前
java--面向对象编程(中级部分)
java·开发语言
mingzhi611 小时前
网安面试会问到的:http的长连接和短连接
http·面试·职场和发展
Xxxx. .Xxxx2 小时前
C语言程序设计实验与习题指导 (第4版 )课后题-第二章+第三章
java·c语言·开发语言
姜西西_2 小时前
[Spring]Spring MVC 请求和响应及用到的注解
java·spring·mvc
逸狼2 小时前
【JavaEE初阶】多线程6(线程池\定时器)
java·开发语言·算法
qq_35323353892 小时前
【原创】java+springboot+mysql科研成果管理系统设计与实现
java·spring boot·mysql·mvc·web
dawn1912282 小时前
SpringMVC 入门案例详解
java·spring·html·mvc