Java面试八股之Redis有哪些数据类型?底层实现分别是什么

  1. Redis有哪些数据类型?底层实现分别是什么

Redis数据类型概述

Redis作为一款键值存储系统,提供了丰富多样的数据类型以满足不同场景的需求。以下是Redis支持的主要数据类型及其基本用途:

String(字符串)

存储单个键值对,支持增删改查、自增、截取等操作。

应用场景:计数器、缓存、分布式锁等。

底层实现:Redis字符串是动态字符串(SDS),其内部结构包含长度、已用长度和字节数组。

编码方式:Redis对字符串值的存储采用多种编码,如:

REDIS_ENCODING_INT:当值为整数且在一定范围内时,直接存储整数值,节省空间。

REDIS_ENCODING_EMBSTR:对于短字符串,使用embstr编码,将字符串与结构体紧凑存储在同一块连续内存中,减少内存分配次数。

REDIS_ENCODING_RAW:长字符串或非整数值使用raw编码,即传统的简单动态字符串。

List(列表)

有序的字符串列表,支持两端插入、弹出、范围查询等操作。

应用场景:消息队列、最新N个元素列表等。

底层实现:列表有两种编码方式,分别是:

ziplist(压缩列表):对于元素数量少且元素长度较短的列表,使用连续内存存储,节省空间。

linkedlist(双端链表):当列表元素数量或长度超过一定阈值时,转为双端链表实现,保证操作的高效性。

Set(集合)

无序的字符串集合,不允许重复成员,支持添加、删除、成员关系判断等操作。

应用场景:标签系统、唯一性检查、交并差集运算等。

底层实现:集合也有两种编码:

intset(整数集合):当集合中所有元素都是整数且范围适当时,使用整数集合存储,空间效率高。

hashtable(哈希表):当集合包含非整数元素或元素数量超过一定阈值时,转化为哈希表实现,提供快速的增删查操作。

Sorted Set(有序集合)

类似集合,但每个成员附带一个分数,依据分数进行排序。

支持添加、删除、按分数范围查询、排名、聚合操作等。

应用场景:排行榜、带权重的标签系统、Top N查询等。

底层实现:有序集合基于ziplist或skiplist(跳跃表)编码:

ziplist:小型有序集合,使用压缩列表存储,元素按分数排序。

skiplist:大型有序集合,使用跳跃表实现,提供O(log N)的插入、删除、查找等操作,同时保留了集合成员的顺序。

Hash(哈希)

键值对的集合,每个键值对由field-value组成。

支持增删改查单个field,批量操作整个哈希。

应用场景:对象属性存储、购物车等。

底层实现:哈希同样存在两种编码:

ziplist:对于小规模哈希(字段数量和值长度较小),使用压缩列表存储,紧凑且高效。

hashtable:当哈希的字段数量或值长度超过阈值时,转化为哈希表实现,提供快速的字段查找和更新。

Bitmaps(位图)

功能:Bitmaps允许以位(bit)为单位存储数据,非常适合用来表示稀疏的二进制状态,如用户签到、统计用户行为等。

应用案例:用户签到系统

假设有一个网站需要记录用户每天的签到情况。对于每个用户,我们可以使用一个唯一的用户ID作为键名,用Bitmaps来表示其连续365天的签到状态。每天签到时,使用SETBIT命令将对应日期的位设置为1。查询用户在过去一周是否有连续签到,则可通过BITCOUNT命令计算过去7天的位图中值为1的位数。

底层实现:在Redis中,位图实际上是基于字符串(String)类型实现的,每个字节(8位)对应字符串中的一个字符。通过对字符串执行位操作命令(如SETBIT, GETBIT, BITCOUNT, BITOP等),可以高效地进行位的增删查改。

HyperLogLog

功能:HyperLogLog是一种概率数据结构,用于估算集合中不重复元素(基数)的大致数量,而不需要存储所有元素。它以极小的空间开销(通常几百字节)提供接近精确的计数,适用于大规模唯一计数场景,如网站独立访客统计、唯一事件计数等。

应用案例:网站独立访客统计

在一个网站中,需要统计每天访问的独立访客数,但不想为每个访客保存完整的访问记录。可以为每天创建一个HyperLogLog键,每当有新的访客访问时,将其唯一标识符(如IP地址或用户代理字符串的哈希值)添加到当天的HyperLogLog中。使用PFADD命令添加元素,PFCOUNT命令获取估计的独立访客数。

底层实现:HyperLogLog使用特定的哈希函数和概率算法估计基数,不直接存储元素,而是维护一个内部状态来近似计数。

Geospatial Indexes(地理位置索引)

功能:Redis提供了对地理位置数据的支持,可以存储经纬度坐标,并进行距离查询、范围查询(如"附近的人"功能)、地理围栏(如"在某区域内的人")等操作。

应用案例:"附近的人"功能

在社交应用中,用户可以查看当前位置附近的其他在线用户。为每个用户存储其经纬度坐标,使用GEOADD命令将用户位置添加到地理位置索引中。当查询时,使用GEORADIUS或GEORADIUSBYMEMBER命令查找指定半径内的其他用户。

底层实现:使用有序集合(Sorted Set)存储地理位置数据,成员为地理位置的标识符,分值为经过特定公式转换后的经纬度坐标,以此实现空间索引。

Streams(流)

功能:Redis Streams是一种用于存储和处理时间序列数据的数据结构,特别适用于构建消息队列、活动日志、审计跟踪等应用场景。它支持多消费者消费同一数据流的不同部分,并具备消息持久化、消息ID生成、消息分片(Consumer Group)等功能。

应用案例:订单事件日志

在电商系统中,使用Redis Stream记录订单相关的事件,如订单创建、支付成功、发货等。每个事件作为一个消息,包含事件类型、发生时间、订单ID等信息。消费者(如后台任务、实时分析服务)通过XREAD或XREADGROUP命令订阅并处理这些事件。

底层实现:Stream数据结构在内部以键值对的形式存储,键为Stream的名字,值为一个特殊的字典结构,包含多个消息列表(每个消息列表代表一个分片)以及相关元数据。

如果大家需要视频版本的讲解,欢迎关注我的B站:

相关推荐
小钊(求职中)3 分钟前
ElasticSearch从入门到精通-覆盖DSL操作和Java实战
java·大数据·elasticsearch·搜索引擎·全文检索
孔令飞9 分钟前
使用 Go 与 Redis Streams 构建可靠的事件驱动系统
redis·ai·云原生·golang·kubernetes
zayyo14 分钟前
Web 应用轻量化实战
前端·javascript·面试
yuanlaile25 分钟前
Go全栈_Golang、Gin实战、Gorm实战、Go_Socket、Redis、Elasticsearch、微服务、K8s、RabbitMQ全家桶
linux·redis·golang·k8s·rabbitmq·gin
极客智谷28 分钟前
深入理解Java线程池:从原理到实战的完整指南
java·后端
高效匠人33 分钟前
FastAPI + Redis Pub/Sub + WebSocket 组合解决方案的详细介绍
redis·websocket·fastapi
代码不行的搬运工35 分钟前
HTML快速入门-4:HTML <meta> 标签属性详解
java·前端·html
lovebugs1 小时前
Redis的高性能奥秘:深入解析IO多路复用与单线程事件驱动模型
redis·后端·面试
mask哥1 小时前
详解最新链路追踪skywalking框架介绍、架构、环境本地部署&配置、整合微服务springcloudalibaba 、日志收集、自定义链路追踪、告警等
java·spring cloud·架构·gateway·springboot·skywalking·链路追踪
XU磊2601 小时前
javaWeb开发---前后端开发全景图解(基础梳理 + 技术体系)
java·idea