【Redis】zset数据类型相关指令

zset简单介绍

有序集合相对于字符串、列表、哈希、集合来说会有一些陌生。它保留了集合不能有重复成员的特点，但与集合不同的是，有序集合中的每个元素都有一个唯一的浮点类型的分数（score）与之关联，着使得有序集合中的元素是可以维护有序性的，但这个有序不是用下标作为排序依据而是用这个分数。这里的有序和 list 的有序又是不同的有序，zset 的有序是明确的升序降序的顺序（默认查询是升序，但是也能降序，所以我们认为其就是有顺序，升序降序都是），list 的有序是按照下标的顺序。有序集合中的元素是不能重复的，但分数允许重复。类比于一次考试之后，每个人一定有一个唯一的分数，但分数允许相同。

数据结构	是否允许重复元素	是否有序	有序依据	应用场景
列表	是	是	索引下标	时间轴、消息队列等
集合	否	否	-	标签、社交等
有序集合	否	是	分数	排行榜系统、社交等

zadd

添加或者更新指定的元素以及关联的分数到 zset 中，分数应该符合 double 类型，+inf/-inf 作为正负极限也是合法的。

不带选项的使用就是将 score 和 member 添加进 zset 中，这里不是 key - value 的结构，因为后面我们会知道 score 和 member 可以互相寻找，这里我们称这两个组成一个 pair。如果 key 不存在就会创建。

除了最基本的使用，zadd还有多个选项：

XX：仅仅用于更新已经存在的元素，不会添加新元素。

NX：仅用于添加新元素，不会更新已经存在的元素。

LT：仅当新分值小于当前分值时，更新已存在的元素。此标志不阻止添加新元素。

GT：仅当新分值大于当前分值时，更新已存在的元素。此标志不阻止添加新元素。

CH：将返回值从 "新增元素的数量" 修改为 "发生变更的元素总数"（CH 是 changed 的缩写）。发生变更的元素包括新增的元素，以及分值被更新的已有元素。因此，命令行中指定的元素若分值与原有分值相同，则不计入统计。注：默认情况下，ZADD 的返回值仅统计新增元素的数量。

INCR：指定此选项时，ZADD 的行为等同于 ZINCRBY。此模式下仅能指定一组 "分值 - 元素" 对。

注：GT、LT 和 NX 选项互斥。在 Redis 中，\[\] 表示可有可无，\[\] 中的 | 表示或，二选一互斥的意思。

注意这里的下标也支持倒数。

注意 zadd 的指令返回的是新增的元素数，所以如果只是更新数值，那么会返回0，这点在使用改值指令时较为不直观，这也是选项 CH 的存在意义。

incr 选项不支持多个 score - member，可以通过负数实现减法。

该指令的时间复杂度为每个 score - member O(log(N))，因为其底层是跳表，优化查找时间复杂度为 log(N)，这里的 N 是元素数，如果查找 M 个 score - member，时间复杂度为 M * O(log(N))。

此外，之前说过 Redis 支持重复 score，如果 score 相同，则是会按照 members 以字典序进行排序，如果是降序则是反着的字典序。

最后，分数支持小数操作，也支持 -inf 和 inf（Redis 中 zset 分值支持的特殊浮点数值，本质对应数学里的 "无穷大 / 无穷小" 概念），不过不支持会导致 NaN（非数字）的无穷值运算（核心是 inf - inf/-inf + inf 这类运算，而非所有 -inf 和 inf 之间的计算）。

zcard

获取一个 zset 的基数（cardinality），即 zset 中的元素个数。

zcount

返回分数在 min 和 max 之间的元素个数，默认情况下，min 和 max 都是包含的，可以通过 ( 排除。

这里我们可以使用 ( 表示开区间，但是奇葩的是无论左右都是用的 (。这个指令的时间复杂度是 O(log(N))，为什么呢？如果按照正常想法，知道 min 和 max 之间的元素数不应该是先根据 min 和 max 找到对应的元素，再去遍历元素之间的值计数吗，其实 zset 的内部记录每个元素的排名，查询元素的时间复杂度之前也说了是 O(log(N)) ，当我们找到了元素，就能根据一头一尾的排名相减得出答案。

zrange

返回指定区间里的元素，分数按照升序。带上 withscores 可以把分数也返回。

使用 withscores 可以加上 score。可以看到如果改了 score，排序自动变。

6.2版本之后，加上了几个选项：

BYSCORE：按分值范围查询（替代下标范围），把 start/stop 从 "下标" 改成 "分值"，查询分值在 $start, stop$ 区间的元素。

BYLEX：按元素字典序范围查询（需元素分值相同），把 start/stop 从 "下标" 改成 "字符串字典序"，仅当 zset 所有元素分值相同时有效。

REV：反向排序（降序）。

LIMIT offset count：分页（仅在 BYSCORE/BYLEX 后生效），对查询结果做分页，跳过 offset 个元素，返回最多 count 个元素。

也因此 zrange 可以替换一些指令，这些指令之后可能会被优化掉（zrevrange，zrangebyscore，zrevrangebyscore，zrangebylex，zrevrangebylex）。

zrevrange

返回指定区间里的元素，分数按照降序。带上 withscores 可以把分数也返回。

已被标记废弃。

zrangebyscore

返回分数在 min 和 max 之间的元素，默认情况下，min 和 max 都是包含的，可以通过 ( 排除。

已被标记废弃。

zpopmax

删除并返回分数最高的 count 个元素。

可以用来解决一些 topk 问题。注意这里的时间复杂度是 O(log(N) * M)，N 是元素数，M 是 count。这里的 popmax 其实就是尾删，那么根据之前的经验，为什么不优化一些，记录一下尾部，然后 O(1) 删除呢？猜测是性能瓶颈不大，就没有优化。

bzpopmax

ZPOPMAX 的阻塞版本。

返回结果会带上 key，因为可以监视多个 key，且搞到一个结果就直接返回，所以时间复杂度是 O(log(N))。

timeout（超时时间）参数被解析为一个双精度浮点数，用于指定最大阻塞时长（以秒为单位）。超时时间设为 0 时，表示永久阻塞。

zpopmin

删除并返回分数最低的 count 个元素。

bzpopmin

ZPOPMAX 的阻塞版本。

zrank

返回指定元素的排名，升序。

和 zcount 差不多，而是找到元素，直接得到排名。

zrevrank

返回指定元素的排名，降序。

zscore

返回指定元素的分数。

为什么这里的时间复杂度是 O(1) 呢？可以认为这里有比较大的性能瓶颈，付出了内存的代价，提升了时间复杂度。

zrem

删除指定的元素。

zremrangebyrank

按照排序，升序删除指定范围的元素，左闭右闭。

zremrangebyscore

按照分数删除指定范围的元素，左闭右闭。

zincrby

为指定的元素的关联分数添加指定的分数值。

zinter

求出给定有序集合中元素的交集，在合并过程中以元素为单位进行合并，元素对应的分数按照不同的聚合方式和权重得到新的分数。

这里的求并集以 member 为基准的，score 只是附属，不只是这，整个 zset 也是如此，score 都是附属，member 才是元素本身。这里的 weights 指的权重，也就是按照顺序对应的 key 中的元素合并时的重要性，讲人话就是对应 key 的 weights 是几，合并时就会将这个 key 中的元素乘上几，然后按照合并规则来（sum求和，max求最大、min求最小）。这里的 aggregate 就是合并规则，sum求和，max取最大、min求取最小，不写默认求和。注意我们的 key 之前有一个 numkeys，指明我们要写几个 key，因为 key 的后面也有选项，所以如果不这么搞分不清选项和参数了，后面的参数也是可以有多个，所以开头要有 weights、aggregate，好区分解析。

注意该指令的时间复杂度是 O(NK) + O(Mlog(M))。N 是输入的有序集合中，最小的有序集合的元素个数；K 是输入了几个有序集合；M 是最终结果的有序集合的元素个数。

zunion

求出给定有序集合中元素的并集，在合并过程中以元素为单位进行合并，元素对应的分数按照不同的聚合方式和权重得到新的分数。

规则和 zinter 一致。

zinterstore

求出给定有序集合中元素的交集并保存进目标有序集合中，在合并过程中以元素为单位进行合并，元素对应的分数按照不同的聚合方式和权重得到新的分数。

如果目标 key 不存在会自动创建。

zunionstore

求出给定有序集合中元素的并集并保存进目标有序集合中，在合并过程中以元素为单位进行合并，元素对应的分数按照不同的聚合方式和权重得到新的分数。

编码方式

有序集合类型的内部编码有两种：
ziplist（压缩列表） ：当有序集合的元素个数小于 zset-max-ziplist-entries 配置（默认 128 个），同时每个元素的值都小于 zset-max-ziplist-value 配置（默认 64 字节）时，Redis 会用 ziplist 来作为有序集合的内部实现，ziplist 可以有效减少内存的使用。
skiplist（跳表）：当 ziplist 条件不满足时，有序集合会使用 skiplist 作为内部实现，因为此时 ziplist 的操作效率会下降。

使用场景

有序集合最典型的使用场景是排行榜系统，比如网站的多维度热榜（时间、阅读量、点赞量等），以点赞数维度维护每日热榜为例，可通过 zset 相关命令完成全流程操作：在添加用户赞数时，可先用 zadd 为用户初始化点赞数，后续新增点赞则通过 zincrby 实现赞数的增量更新；当因用户注销、作弊等原因需要取消用户赞数时，可使用 zrem 将目标用户从对应日期的榜单中删除；要展示点赞数最多的 10 个用户，可借助 zrevrange 命令按分值降序获取排名前 10 的用户；若需展示用户详细信息及对应的赞数、排名，可将用户信息存储在哈希类型中，再通过 zscore 获取用户具体的点赞分数，通过 zrank 获取用户在榜单中的排名。