Redis Set 实战:基于「并、差、交集」的分布式场景应用

文章目录

一、Redis Set 核心特性

Redis Set 是无序、唯一的字符串集合,底层基于哈希表实现,支持高效的交、并、差集运算,天然适配"去重、关系计算"类分布式场景,是实现"共同好友、活动去重、推荐系统"的最优解。

二、Set 核心命令(交、并、差集)

操作类型 命令格式 作用
交集 SINTER key1 key2 [key3...] 返回多个 Set 的共同元素(都包含的元素)
并集 SUNION key1 key2 [key3...] 返回多个 Set 的全部元素(自动去重)
差集 SDIFF key1 key2 [key3...] 返回 key1 有、但其他 key 没有的元素(顺序敏感)
新增元素 SADD key member1 [member2...] 向 Set 中添加元素(Set 自动去重)
查看所有元素 SMEMBERS key 返回 Set 中的所有元素

三、典型应用场景与实战模拟

场景1:交集模拟: 共同好友/共同关注

核心命令 : SINTER

业务思路

将每个用户的"好友/关注列表"存储为独立的 Set,通过交集运算快速获取两个用户的共同好友/关注,无需遍历全量数据。

模拟(命令行)
redis 复制代码
# 1. 初始化数据:用户A和用户B的关注列表
SADD user:follow:A B C D E  # 用户A关注:B、C、D、E
SADD user:follow:B A C D F  # 用户B关注:A、C、D、F

# 2. 计算共同关注(交集)
SINTER user:follow:A user:follow:B  # 返回结果:C、D

# 3. 查看验证
SMEMBERS user:follow:A  # 确认用户A的关注列表
SMEMBERS user:follow:B  # 确认用户B的关注列表

场景2:并集模拟:活动参与用户去重统计

核心命令:SUNION

业务思路

将每个活动的参与用户存储为独立的 Set,通过并集运算汇总所有参与过活动的用户(自动去重),避免重复统计。

模拟(命令行)
redis 复制代码
# 1. 初始化数据:活动1和活动2的参与用户
SADD activity:participant:1 A B C  # 活动1参与用户:A、B、C
SADD activity:participant:2 B C D  # 活动2参与用户:B、C、D

# 2. 统计所有参与过活动的用户(并集)
SUNION activity:participant:1 activity:participant:2  # 返回结果:A、B、C、D

场景3:差集:个性化推荐(好友/内容)

核心命令:SDIFF

业务思路

以"用户已拥有的内容"为基准 Set,减去"候选池内容"的 Set,剩余元素即为"用户未接触过、可推荐的内容",适配好友推荐、音乐/商品推荐等场景。

实战模拟(命令行)
redis 复制代码
# 1. 初始化数据:我的好友 + 好友A的好友
SADD my:friends A B C  # 我的好友:A、B、C
SADD friend:A:friends B C D E  # 好友A的好友:B、C、D、E

# 2. 计算"好友A有但我没有的好友"(差集)
SDIFF friend:A:friends my:friends  # 返回结果:D、E(可推荐给我的好友)
redis 复制代码
# 扩展场景:音乐推荐
SADD my:music 歌1 歌2 歌3  # 我听过的歌
SADD hot:music 歌2 歌3 歌4 歌5  # 热门歌单
SDIFF hot:music my:music  # 返回结果:歌4、歌5(可推荐的新歌)

四、核心优势与适用场景小结

运算类型 核心优势 典型业务场景
交集 快速计算"共同特征",无需全量遍历 共同好友、共同关注、共同喜好、权限交集校验
并集 全局去重汇总,避免重复数据 活动参与用户统计、全量标签汇总、多渠道数据去重
差集 精准筛选"差异化内容",适配推荐逻辑 好友推荐、内容推荐、未读消息筛选、权限缺失校验

关键注意事项

  1. Redis Set 交并差集运算为内存操作,性能极高,适合百万级以下数据量;

  2. 差集运算顺序敏感SDIFF A BSDIFF B A,需根据业务逻辑确认 Set 顺序;

  3. 分布式场景下,可通过多实例分片存储超大 Set,结合 SUNIONSTORE/SINTERSTORE 将运算结果存入新 Set,便于后续复用。

    • 比如我们要计算两个集合交集后的容量
    redis 复制代码
    # 先存结果到临时 key
    SUNIONSTORE temp activity:participant:1 activity:participant:2
    SCARD temp
    DEL temp
相关推荐
喜欢流萤吖~15 小时前
分布式事务:微服务的数据一致性之困
分布式·微服务·架构
小羽网安16 小时前
从零开始学习 sql 注入,常见的 sql 注入解析
数据库·sql·学习
2401_8463395617 小时前
CSS如何优化大型项目样式_使用SASS预处理器提升开发效率
jvm·数据库·python
小码哥_常1 天前
MyBatis-Plus:让数据库操作飞起来的神器
后端
ss2731 天前
食谱推荐系统功能测试如何写?
java·数据库·spring boot·功能测试
2301_811274311 天前
基于SpringBoot的智能家居管理系统
spring boot·后端·智能家居
AI人工智能+电脑小能手1 天前
【大白话说Java面试题】【Java基础篇】第15题:JDK1.7中HashMap扩容为什么会发生死循环?如何解决
java·开发语言·数据结构·后端·面试·哈希算法
舒一笑1 天前
我把设备指纹生成逻辑拆开了:它到底凭什么区分不同设备?
后端·程序员·掘金技术征文
l1t1 天前
DeepSeek总结的数据库外部表
数据库
m0_674294641 天前
如何编写SQL存储过程性能对比_记录执行时间评估优化效果
jvm·数据库·python