Redis set类型 && zset类型

set类型

类型介绍

集合类型也是保存多个字符串类型的元素的,但和列表类型不同的是,集合中 1)元素之间是⽆序
的 2)元素不允许重复 ⼀个集合中最多可以存储 个元素。Redis 除了⽀持 集合内的增删查改操作,同时还⽀持多个集合取交集、并集、差集,合理地使⽤好集合类型,能在实际开发中解决很多问题。

与list不同的主要两点:

1.集合的元素是唯一的(不能重复)

2.集合的元素是无序的。

和list相同的是,集合的每个元素也都是string类型,如果要存储结构化数据,可以用json存储。

sadd / smembers / sismember

sadd

将⼀个或者多个元素添加到 set 中。注意,重复的元素⽆法添加到 set 中。所以是随机删除。

bash 复制代码
SADD key member [member ...]

这里的元素用member来称呼,这样做也是方便区别不同类型的元素,比如hash中就是field。
时间复杂度:O(1)
返回值:本次添加成功的元素个数。

smembers
获取⼀个 set 中的所有元素,注意,元素间的顺序是⽆序的。

bash 复制代码
SMEMBERS key

时间复杂度:O(N)
返回值:所有元素的列表。

sismember
判断⼀个元素在不在 set 中。

bash 复制代码
SISMEMBER key member

时间复杂度:O(1)
返回值:1 表⽰元素在 set 中。0 表⽰元素不在 set 中或者 key 不存在。

scard

scard

获取⼀个 set 的基数(cardinality),即 set 中的元素个数。

bash 复制代码
SCARD key

时间复杂度:O(1)
返回值:set 内的元素个数。

spop / srandmember

spop

pop一般表示从末尾删除某一元素,但是集合中的元素是无序的,哪有什么 "末尾"?
从 set 中删除并返回⼀个或者多个元素。注意,由于 set 内的元素是⽆序的,所以取出哪个元素实际是未定义⾏为,这是删除是完全随机的。
Redis在底层实现的时候就是采取了随机数的删除方式。

bash 复制代码
SPOP key [count]

时间复杂度:O(N), n 是 count
返回值:取出的元素。

srandmember

与spop不同的是,srandmember不会删除,也是完全随机返回一个元素。

bash 复制代码
srandmember key [count]

smove / srem

smove
将⼀个元素从源 set 取出并放⼊⽬标 set 中。

bash 复制代码
SMOVE source destination member

这个 source 表示要从哪个key中删除元素,destination 表示要将这个删除的元素插入到哪个key中。
时间复杂度:O(1)
返回值:1 表⽰移动成功,0 表⽰失败。

需要注意:是先从 source 删除member,然后再将member插入到destination 中。

如果要移动的元素destination 中已经存在,那么也不会报错,因为集合中元素是唯一的,所以destination 中还是只有一份,并且source 中照样还是会删除member。

srem

rem就是remove的缩写
将指定的元素从 set 中删除。可以一次性删除多个。

bash 复制代码
SREM key member [member ...]

时间复杂度:O(N), N 是要删除的元素个数.
返回值:本次操作删除的元素个数。

集合的一些基本概念

以下就介绍一些Redis 交集,并集,差集的操作

sinter / sinterstore

sinter

获取给定 set 的交集中的元素。

bash 复制代码
SINTER key [key ...]

时间复杂度:O(N * M), N 是最⼩的集合元素个数. M 是最⼤的集合元素个数.
返回值:交集的元素。

sinterstore

获取给定 set 的交集中的元素并保存到⽬标 set 中。

bash 复制代码
SINTERSTORE destination key [key ...]

时间复杂度:O(N * M), N 是最⼩的集合元素个数. M 是最⼤的集合元素个数.
返回值:交集的元素个数。

sunion / sunionstore

sunion

获取给定 set 的并集中的元素。

bash 复制代码
SUNION key [key ...]

时间复杂度:O(N), N 给定的所有集合的总的元素个数.
返回值:并集的元素。

sunionstore

bash 复制代码
SUNIONSTORE destination key [key ...]

时间复杂度:O(N), N 给定的所有集合的总的元素个数.
返回值:并集的元素个数。

sdiff / sdiffstore

sdiff

获取给定 set 的差集中的元素。

bash 复制代码
SDIFF key [key ...]

时间复杂度:O(N), N 给定的所有集合的总的元素个数.
返回值:差集的元素。

之前求交集和并集,交换两个集合的顺序,结果是一样的,但是求差集这里,交换集合的顺序,求出来的结果是不一样的。

比如集合A的元素1 2 3 4 集合B的元素 3 4 5 6 ,那么求集合A与集合B的差集结果就是 1 2,反过来求集合B与集合A的差集就是5 6。

sdiffstore

获取给定 set 的差集中的元素并保存到⽬标 set 中。

bash 复制代码
SDIFFSTORE destination key [key ...]

时间复杂度:O(N), N 给定的所有集合的总的元素个数.
返回值:差集的元素个数。

内部编码

集合类型的内部编码有两种:

intset(整数集合):当集合中的元素都是整数并且元素的个数⼩于 set-max-intset-entries 配置
(默认 512 个)时,Redis 会选⽤ intset 来作为集合的内部实现,从⽽减少内存的使⽤。

hashtable(哈希表):当集合类型⽆法满⾜ intset 的条件时,Redis 会使⽤ hashtable 作为集合
的内部实现。

1)当元素个数较少并且都为整数时,内部编码为 intset:

bash 复制代码
127.0.0.1:6379> sadd setkey 1 2 3 4
(integer) 4
127.0.0.1:6379> object encoding setkey

2)当元素个数超过 512 个,内部编码为 hashtable:

bash 复制代码
127.0.0.1:6379> sadd setkey 1 2 3 4
(integer) 513
127.0.0.1:6379> object encoding setkey
"hashtable"

3)当存在元素不是整数时,内部编码为 hashtable:

bash 复制代码
127.0.0.1:6379> sadd setkey a
(integer) 1
127.0.0.1:6379> object encoding setkey
"hashtable"

set应用场景

实现标签

比如用set保存用户的标签 。

用户画像:分析用户的一些特征,然后进行投其所好。

比如喜欢浏览化妆品 或者裙子这些商品 的用户可以打上女人的标签,喜欢浏览数码产品的可以打上男人的标签等等。

或者还可以基于这些标签,计算两个用户是否有相同的爱好。

计算共同好友

其实跟标签的效果差不多,我们使用qq的时候就经常看到qq会给我们推荐一些用户,说这些用户有多少共同好友。其实也是通过求交集的方式来计算的。

计算UV (用户量)

补充概念:

PV:page view,用户每次访问服务器,就会产生一次PV,多次访问就产生多次。

UV:user view:每一个用户访问服务器,只会产生一次UV,多次访问也只有一次。

用UV的信息就可以用set进行去重,然后求出set的大小就可以得知这个服务器的用户量了。

如果想统计访问量就更简单了,每次访问都会产生一个日志,然后记录这个日志的数量就可以了

一般可以每日将这些数据刷新一次,这样就可以动态了解这个网站的访问量和用户量了。

zset类型

类型介绍

有序集合相对于字符串、列表、哈希、集合来说会有⼀些陌⽣。它保留了集合不能有重复成员的
特点,但与集合不同的是,有序集合中的每个元素都有⼀个唯⼀的浮点类型的分数(score)与之关联,着使得有序集合中的元素是可以维护有序性的,但这个有序不是⽤下标作为排序依据⽽是⽤这个分数。

注意:在有序集合这里,有序指的是升序,而不是顺序,这里的概念与集合那里是不一样的。

简单对比以下list set zset

zadd / zrange

添加或者更新指定的元素以及关联的分数到 zset 中,分数应该符合 double 类型,+inf/-inf 作为正负极限也是合法的。
ZADD 的相关选项:

XX:仅仅⽤于更新已经存在的元素,不会添加新元素。

NX:仅⽤于添加新元素,不会更新已经存在的元素。

CH:默认情况下,ZADD 返回的是本次添加的元素个数,但指定这个选项之后,就会还包含本次更新的元素的个数。(会影响zadd的返回值)

INCR:此时命令类似 ZINCRBY 的效果,将元素的分数加上指定的分数。此时只能指定⼀个元素和分数,此时返回值就是修改后的key的分数。(会改变zadd的返回值)

bash 复制代码
ZADD key [NX | XX] [GT | LT] [CH] [INCR] score member [score member
 ...]

时间复杂度:O(log(N))
返回值:本次添加成功的元素个数(默认),有些选项会导致返回值的含义不同。

另外 在Redis5版本中,GT LT 选项是没有的

LT:less than ,只有修改的key的分数 小于原来的,才会修改成功。

GT:greater than,只有当修改的key的分数大于原来的,才会修改成功。

注意:不要把这里的member score当作键值对来看待,在键值对中,是有明确的 角色区分 的,只能通过 键 -> 值 的方式,而不能反过来。但是对于有序集合来说,既可以通过member找到对应的score,也可以通过score匹配对应的member。

zrange

区间查找有序集合中的元素,用法跟lrange类似。

bash 复制代码
zrange key start stop [withscores]

时间复杂度:O(log(N)+M)
返回值:区间内的元素列表

下标依旧可以为负数,意义跟以往的一样。

withscores:选择是否要把分数一起显示出来。

zcard / zcount

zcard

获取⼀个 zset 的基数(cardinality),即 zset 中的元素个数。

bash 复制代码
ZCARD key

时间复杂度:O(1)
返回值:zset 内的元素个数。

zcount

返回分数在 min 和 max 之间的元素个数,默认情况下,min 和 max 都是包含的,可以通过 ( 排除。

bash 复制代码
ZCOUNT key min max

时间复杂度:O(log(N))
返回值:满⾜条件的元素列表个数。

zset的底层实现其实是使用跳表的,一般来说查找满足这个区间的元素,那么时间复杂度不应该是O(N)吗?其实Redis给每个元素都加上了一个 "排行" 也就是它是第几个元素,所以就只需要找到min和max就可以了。

另外,这里的查找都是按照闭区间来查找的,[min,max],如果想要以开区间的方式,那么需要在边界值前加上 ( 。比如

注意这里加括号的方式是不大符合直觉的。

zrevrange / zrangebyscore

zrevrange
返回指定区间⾥的元素,分数按照降序。带上 WITHSCORES 可以把分数也返回。

备注:这个命令可能在 6.2.0 之后废弃,并且功能合并到 ZRANGE 中。

bash 复制代码
ZREVRANGE key start stop [WITHSCORES]

时间复杂度:O(log(N)+M)
返回值:区间内的元素列表。

这里的start 和stop的顺序和 zrange是一样,只是zrevrange会把结果逆序返回。

zrangebyscore
返回分数在 min 和 max 之间的元素,默认情况下,min 和 max 都是包含的,可以通过 ( 排除。
备注:这个命令可能在 6.2.0 之后废弃,并且功能合并到 ZRANGE 中。

bash 复制代码
ZRANGEBYSCORE key min max [WITHSCORES]

时间复杂度:O(log(N)+M)
返回值:区间内的元素列表。

zpopmax

删除并返回分数最⾼的 count 个元素。

bash 复制代码
ZPOPMAX key [count]

count表示删多少个,默认一个。
命令有效版本:5.0.0 之后,这是Redis5以后加入的。
时间复杂度:O(log(N) * M),M指count的个数。
返回值:分数和元素列表。

如果删除的元素分数是一样的,那么会按照字典序来删。

另外关于这个时间复杂度这里,我们知道zset是跳表结构的,所以元素都是有序的,又因为删除的元素是最大值,所以为什么不搞一个值来记录尾部,这样删除的时候,查找的时间复杂度不就降为O(1)了吗?确实,但是Redis目前并没有这么做 。

bzpopmax

bzpopmax

ZPOPMAX 的阻塞版本。

bash 复制代码
BZPOPMAX key [key ...] timeout

命令有效版本:5.0.0 之后
时间复杂度:O(log(N))
返回值:元素列表。

timeout就是要等待多少时间,也就是超时时间,单位是 秒,支持小数,比如 0.1s表示 100ms。

这里的timeout是不能省略的。另外要注意这里的时间复杂度, 虽然bzpopmax可以等待多个key,但是它只会删除最先就绪的那一个key,并且只删除一个。

zpopmin / bzpopmin

zpopmin

删除并返回分数最低的 count 个元素。

bash 复制代码
ZPOPMIN key [count]

命令有效版本:5.0.0 之后
时间复杂度:O(log(N) * M)
返回值:分数和元素列表。

用法与zpopmax一致。

bzpopmin

ZPOPMIN 的阻塞版本。

bash 复制代码
BZPOPMIN key [key ...] timeout

命令有效版本:5.0.0 之后
时间复杂度:O(log(N))
返回值:元素列表。

zrank / zrevrank / zscore

zrank

返回指定元素的排名,升序。

这里的排名其实就是下标,从0开始的。

bash 复制代码
ZRANK key member

命令有效版本:2.0.0 之后
时间复杂度:O(log(N))
返回值:排名(下标)。

zrevrank

返回指定元素的排名,降序。

bash 复制代码
ZREVRANK key member

命令有效版本:2.0.0 之后
时间复杂度:O(log(N))
返回值:排名。

zscore

返回指定元素的分数。

bash 复制代码
ZSCORE key member

命令有效版本:1.2.0 之后
时间复杂度:O(1)
返回值:分数。

这里zscore的时间复杂度按我们之前的想法应该是O(logN)才对,但是注意这里是O(1),这是因为Redis觉得这个命令应该是高频使用的命令,容易成为性能瓶颈,所以用额外的空间进行了特殊的优化,使其时间复杂度降到了O(1)。

zrem / zremrangebyrank / zremrangebyscore

zrem

删除指定的元素。

bash 复制代码
 ZREM key member [member ...]

命令有效版本:1.2.0 之后
时间复杂度:O(M*log(N))
返回值:本次操作删除的元素个数。

zremrangebyrank

按照排序,升序删除指定范围的元素,左闭右闭。 这里不能通过加(的方式表示开区间

bash 复制代码
ZREMRANGEBYRANK key start stop

命令有效版本:2.0.0 之后
时间复杂度:O(log(N)+M)
返回值:本次操作删除的元素个数。

注意这里的时间复杂度那里是 N + M,而不是 N * M,因为这里的查找只需要查找一次。

zremrangebyscore

按照分数删除指定范围的元素,左闭右闭。 同理

bash 复制代码
ZREMRANGEBYSCORE key min max

命令有效版本:1.2.0 之后
时间复杂度:O(log(N)+M)
返回值:本次操作删除的元素个数。

zincrby

zincrby

为指定的元素的关联分数添加指定的分数值。(这个增量可以是浮点数,也可以是负数)

bash 复制代码
ZINCRBY key increment member

命令有效版本:1.2.0 之后
时间复杂度:O(log(N))
返回值:增加后元素的分数。

zinterstore

zinterstore
求出给定有序集合中元素的交集并保存进⽬标有序集合中,在合并过程中以元素为单位进⾏合并,元素对应的分数按照不同的聚合⽅式和权重得到新的分数。

bash 复制代码
ZINTERSTORE destination numkeys key [key ...] [WEIGHTS weight
 [weight ...]] [AGGREGATE <SUM | MIN | MAX>]

命令有效版本:2.0.0 之后
时间复杂度:O(N*K)+O(M*log(M)) N 是输⼊的有序集合中, 最⼩的有序集合的元素个数; K 是输⼊了⼏个有序集合; M 是最终结果的有序集合的元素个数.
返回值:⽬标集合中的元素个数

关于这里的时间复杂度,看似很复杂,其实不用特别记忆

关于命令部分:

destination ,我们将求完交集的结果会放入到这个key中。

numkeys 参数表示我们要传入多少个key,如果要传入两个key,那么就填入2

[WEIGHTS weight [weight ...]] 这里表示权重,比如我们之前传入了两个key,key1 key2 ,我们可以按照一定的比重来计算分数,比如key1的元素分数只想占40%,key2的想占60%,那么这里就可以传入 WEIGHTS 0.4 0.6 。当然也可以传入大于1的数,不一定表示比重。

[AGGREGATE <SUM | MIN | MAX>] 这里表示对交集元素的分数怎么处理,sum表示将交集的元素相加,min表示取最小值,max取最大值。

使用示例:

可以看见,求交集默认是将元素的分数相加。然后我们还给了权重,将key1的元素的分数 * 2,将key2的元素的分数 * 3。

zunionstore

求出给定有序集合中元素的并集并保存进⽬标有序集合中,在合并过程中以元素为单位进⾏合并,元素对应的分数按照不同的聚合⽅式和权重得到新的分数。

bash 复制代码
ZUNIONSTORE destination numkeys key [key ...] [WEIGHTS weight
 [weight ...]] [AGGREGATE <SUM | MIN | MAX>]

命令有效版本:2.0.0 之后
时间复杂度:O(N)+O(M*log(M)) N 是输⼊的有序集合总的元素个数; M 是最终结果的有序集合的元素个数.
返回值:⽬标集合中的元素个数

这里的用法和细节跟zinterstore是一样的。

命令小结:

zset的内部编码

有序集合类型的内部编码有两种:

ziplist(压缩列表):当有序集合的元素个数⼩于 zset-max-ziplist-entries 配置(默认 128 个),
同时每个元素的值都⼩于 zset-max-ziplist-value 配置(默认 64 字节)时,Redis 会⽤ ziplist 来作
为有序集合的内部实现,ziplist 可以有效减少内存的使⽤。

skiplist(跳表):当 ziplist 条件不满⾜时,有序集合会使⽤ skiplist 作为内部实现,因为此时
ziplist 的操作效率会下降。

另外跳表还比较适合范围查询。

zset应用场景

排行榜系统

有序集合⽐较典型的使⽤场景就是排⾏榜系统。例如常⻅的⽹站上的热榜信息,榜单的维度可能
是多⽅⾯的。
有比较简单的,比如某些游戏,按分数来指定一个天梯排行榜,它就可以只用userid 和 score。

复杂一点的,比如微博的热度排行榜。

相关推荐
桀桀桀桀桀桀29 分钟前
数据库中的用户管理和权限管理
数据库·mysql
superman超哥2 小时前
04 深入 Oracle 并发世界:MVCC、锁、闩锁、事务隔离与并发性能优化的探索
数据库·oracle·性能优化·dba
用户8007165452002 小时前
HTAP数据库国产化改造技术可行性方案分析
数据库
minihuabei2 小时前
linux centos 安装redis
linux·redis·centos
legend_jz2 小时前
STL--哈希
c++·算法·哈希算法
engchina2 小时前
Neo4j 和 Python 初学者指南:如何使用可选关系匹配优化 Cypher 查询
数据库·python·neo4j
engchina2 小时前
使用 Cypher 查询语言在 Neo4j 中查找最短路径
数据库·neo4j
尘浮生2 小时前
Java项目实战II基于Spring Boot的光影视频平台(开发文档+数据库+源码)
java·开发语言·数据库·spring boot·后端·maven·intellij-idea
威哥爱编程2 小时前
SQL Server 数据太多如何优化
数据库·sql·sqlserver
小华同学ai3 小时前
AJ-Report:一款开源且非常强大的数据可视化大屏和报表工具
数据库·信息可视化·开源