基于 Redis 实现的简易分布式滑动窗口组件

1. 背景目标

近期运营团队反馈，飞书消息接收者出现明显的消息疲劳现象。经分析发现，各业务消息的发送必要性需结合具体场景判断，仅依靠发送量无法准确识别冗余消息。

为了解决这种消息疲劳问题，除了从业务层面进行规范外，还可以从技术角度出发，通过滑动窗口限流机制来控制消息发送频率

2. 滑动窗口理解

结合飞书消息场景，用图的方式进一步理解滑动窗口。

例如：x 轴表示时间，单位为秒。下图是从第1秒到第15秒，绿色表示发送给某一个人的消息时刻。

那么如何定义发送消息是否频率过高呢？

在 TCP 网络传输中，采用滑动窗口来控制流量。(下图为网络传输)

那么也可以按照这种思想，将窗口大小定位为 5s。在窗口5s 内，最多接收1条消息，如果多了就表示接收频率过高了。

时间:1-5s，接收到 1 条消息，频率合理

时间:2-6s，接收到 2 条消息，超过 1 条，频率不合理。

时间:4-8s, 接收到 2 条消息，超过 1 条，频率不合理。

时间:7-11s, 接收到 2 条消息，超过 1 条，频率不合理。

以5秒为时间窗口，最多仅允许接收1条消息。第6秒、第8秒、第11秒的发送行为被判定为频率过高。

我们继续以5秒窗口、最多1条消息的规则为例，给出一个符合该规则的健康发送时间序列（只要在任意时间窗口内只包含1条消息即可，图中粉色标记为发送时刻）

通过动态滑动的5秒窗口进行持续检测，确保任意连续5秒内消息不超过1条，即可实现平滑的消息控制。

3. 场景应用

这样的场景还有很多，举一些例子。

场景情况举例	规则抽象
最近1小时，最多收到1条飞书消息	窗口：1h，阈值：1
最近1天，最多重试3次	窗口：1d，阈值：3
最近1h，如果发生3次，则发出警告	窗口: 1h, 阈值：3
......	......

通过场景抽象，编写了一套简易的API以支持上面场景。

4. API规范

该API规范基于Redis底层接口实现，提供了一套简易的滑动窗口限流机制。下面是简易流程图：根据唯一 Key，内部生成一个计数器。每次请求，会判断计数是否达到阈值。

详细接口如下：

java 复制代码

public interface SlidingWindowLimitService {


    /**
     * 滑动窗口判断
     *
     * @param key                唯一key
     * @param windowLenInSeconds 窗口大小
     * @param threshold          阈值
     * @return 如果未达到阈值，则返回true；否则返回 false。如果返回false，则不会对此次请求计数。
     * 举例：windowLenInSeconds=3s， threshold=2，则表示在3秒内，最多只能请求2次。当窗口内的请求超过2次，则返回false，并且不会对此次请求计数。
     */
    boolean calculate(String key, long windowLenInSeconds, long threshold);


    /**
     * 滑动窗口判断
     *
     * @param key   唯一key
     * @param scene 基于特定场景，可以通过场景从配置中心换取 阈值和窗口大小
     * @return 如果未达到阈值，则返回true；否则返回 false。如果返回false，则不会对此次请求计数。
     * 举例：windowLenInSeconds=3s， threshold=2，则表示在3秒内，最多只能请求2次。当窗口内的请求超过2次，则返回false，并且不会对此次请求计数。
     */
    boolean calculate(String key, String scene);
}

核心 API 能力 ：boolean calculate(String key, long windowLenInSeconds, long threshold) ;

key：业务场景唯一标准，比如xxx模版下的飞书消息发送
windowLenInSeconds：时间窗口大小，单位秒
threshold：阈值

使用案例：给用户A发送告警消息，窗口1h小时，最多收到2条。

key：user_id_123_ alarm
windowLenInSeconds：3600
threshold：2

当在窗口1h内，如果达到3次，boolean 返回值为 false。业务可以根据 false 这个接口阻止消息的发送。

命名建议: Key采用"业务模块:用户标识:场景"结构（例：alert:user123:high_priority）

boolean calculate(String key, String scene); scene 目前封装了场景。可以从 nacos 中动态配置规则。

补充部分细节

基于 Redis 中 ZSet 实现滑动窗口机制

每次发送消息时，将当前时间戳插入ZSet；
删除窗口外的旧时间戳；
判断当前窗口内元素数量是否超过阈值

更多细节可以参考上一篇文章：juejin.cn/post/733954...

5. 如何使用

该项目是一个 Spring Boot Starter 模块，可作为公共依赖引入使用。

特别注意：该项目依赖 RedisTemplate，需要配置 redis，如果需要使用 scene，需要添加 spotter nacos sdk

使用案例如下：

java 复制代码

@RestController
@RequestMapping("/test")
public class SlidingWindowLimitTestController {

    @Autowired
    private SlidingWindowLimitService slidingWindowLimitService;

    @GetMapping("/calculate")
    public boolean slidingWindowCalculate(@RequestParam("key") String key, @RequestParam("scene") String scene) {
        return slidingWindowLimitService.calculate(key, scene);
    }


    @GetMapping("/calculateLimit")
    public boolean slidingWindowCalculate(@RequestParam("key") String key,
                                          @RequestParam("windowLenInSeconds") long windowLenInSeconds,
                                          @RequestParam("threshold") long threshold
    ) {
        return slidingWindowLimitService.calculate(key, windowLenInSeconds, threshold);
    }
}

使用案例参考：module: sliding-window-starter 代码地址：github.com/uzong/slidi...

6. 注意事项

本SDK依赖Redis，请确保Redis服务可用。（如果使用 ZSet 的计算压力过高，会再单独申请一个 Redis 实例，专职专用）
合理设置时间窗口和阈值，避免过度限制正常用户
key 的命名应尽量添加业务前缀，以提升唯一性，确保全局唯一
滑动窗口不同于固定窗口，它会随着时间进行滑动。滑动窗口对时间更敏感，能避免"窗口边缘突增"问题

7. 补充细节

redis 中 zset 的部分API 的时间复杂度

ZADD：时间复杂度：O(M*log(N))，其中 M 是成功添加的成员数，N 是有序集合的基数
ZRANGEBYSCORE：时间复杂度：O(log(N)+M)，其中 N 是有序集合的基数，M 是符合条件的成员数量
ZSCAN：迭代有序集合中的元素。时间复杂度：O(1) 随着迭代次数的增加而增加