Java 漏斗算法及应用场景

在Java中，漏斗算法 （Leaky Bucket Algorithm）通常指流量整形 或限流策略。它的核心思想是将请求视为水流，倒入一个底部有洞的漏斗中。

如果漏斗未满 ：请求正常流入并排队，以恒定的速率（漏孔大小）流出并被处理。
如果漏斗已满：新请求将被丢弃（溢出），从而保护下游系统。

1. 核心原理（与令牌桶的区别）

特性	漏斗算法（Leaky Bucket）	令牌桶算法（Token Bucket）
输出速率	绝对恒定，无论输入流量多大。	允许突发流量（只要有令牌，就可瞬时高速输出）。
处理方式	请求在桶内排队，以固定速率消费。	请求直接取令牌，取到即处理。
适用场景	需要平滑突发流量，对输出速率有严格要求（如数据库写入）。	允许一定突发，追求高吞吐和低延迟（如网关API限流）。

2. Java 代码实现（基于队列 + 定时任务）

最可靠的实现是使用阻塞队列 + ScheduledExecutorService 模拟匀速消费。

java 复制代码

import java.util.concurrent.*;
import java.util.concurrent.atomic.AtomicInteger;

public class LeakyBucketLimiter {

    // 漏斗容量（队列最大大小）
    private final int capacity;
    // 漏出速率（单位：毫秒/个）
    private final long leakIntervalMs;
    // 阻塞队列存放请求ID或任务
    private final BlockingQueue<String> queue;
    // 记录被丢弃的请求数（监控用）
    private final AtomicInteger discardedCount = new AtomicInteger(0);

    public LeakyBucketLimiter(int capacity, int leakRatePerSecond) {
        this.capacity = capacity;
        this.leakIntervalMs = 1000 / leakRatePerSecond;
        this.queue = new LinkedBlockingQueue<>(capacity);
        // 启动后台线程以固定速率消费队列
        startLeaking();
    }

    // 后台漏出线程
    private void startLeaking() {
        ScheduledExecutorService scheduler = Executors.newSingleThreadScheduledExecutor();
        scheduler.scheduleAtFixedRate(() -> {
            String request = queue.poll();
            if (request != null) {
                // 模拟处理请求（调用真实业务逻辑）
                System.out.println("Processing: " + request + " at " + System.currentTimeMillis());
            }
        }, 0, leakIntervalMs, TimeUnit.MILLISECONDS);
    }

    // 尝试放入请求（外部调用）
    public boolean tryAcquire(String requestId) {
        boolean offered = queue.offer(requestId); // 非阻塞，队列满则返回false
        if (!offered) {
            discardedCount.incrementAndGet();
            System.out.println("Request " + requestId + " discarded. Queue full.");
        }
        return offered;
    }

    // 获取当前丢弃总数
    public int getDiscardedCount() {
        return discardedCount.get();
    }

    // 测试示例
    public static void main(String[] args) throws InterruptedException {
        LeakyBucketLimiter limiter = new LeakyBucketLimiter(10, 2); // 容量10，每秒漏出2个

        // 模拟瞬间20个请求涌入
        for (int i = 0; i < 20; i++) {
            String reqId = "Req-" + i;
            limiter.tryAcquire(reqId);
            Thread.sleep(50); // 间隔50ms发送
        }

        Thread.sleep(5000); // 等待处理完成
        System.out.println("Total discarded: " + limiter.getDiscardedCount());
    }
}

输出效果 ：即使前10个请求立即占满队列，后续请求被丢弃。队列中的请求会以 500ms/个 的间隔匀速被消费。

3. 简化实现（计数器版本）------ 不推荐

如果你仅仅追求固定时间窗口内的总请求数控制 ，可以用 AtomicLong 配合时间戳重置。但这不是严格意义上的漏斗，因为它允许窗口末期的突发流量。

java 复制代码

// 简单计数器（固定窗口），不能平滑流量，仅做演示
public class SimpleCounterLimiter {
    private final int maxRequestsPerSecond;
    private AtomicLong counter = new AtomicLong(0);
    private volatile long lastResetTime = System.currentTimeMillis();

    public boolean tryAcquire() {
        long now = System.currentTimeMillis();
        if (now - lastResetTime > 1000) {
            counter.set(0);
            lastResetTime = now;
        }
        return counter.incrementAndGet() <= maxRequestsPerSecond;
    }
}

4. 工业级实现推荐（Guava RateLimiter）

Guava 的 RateLimiter 实现的是令牌桶（允许突发），但如果你将 burst 设置为 0，它也能模拟近乎漏斗的效果。

java 复制代码

import com.google.common.util.concurrent.RateLimiter;

// 每秒发出 2 个许可（稳定速率）
RateLimiter limiter = RateLimiter.create(2.0); 
// 预热期平滑（可选）
// RateLimiter.create(2.0, 1, TimeUnit.SECONDS);

if (limiter.tryAcquire()) {
    // 处理请求
} else {
    // 拒绝请求
}

注意：tryAcquire() 默认是非阻塞的，acquire() 是阻塞的。Guava 是生产环境的首选。

5. 真实应用场景详解

场景一：保护数据库写入（削峰填谷）

问题：双11大促，订单数据瞬时写入MySQL，每秒5万QPS，但数据库连接池最大只能承受2000 TPS。
方案：在Service层前加漏斗，容量设为2000，漏出速率设为2000/s。所有请求在漏斗内排队，以安全速率写入DB，避免数据库连接池耗尽或CPU打满。

场景二：外部API调用（第三方限流）

问题：调用微信支付接口，对方限制每分钟最多300次。
方案：漏斗容量设为300，漏出速率设为5/s（300/60）。严格匀速调用，杜绝因突发超限被拉黑。

场景三：消息队列消费平滑

问题：Kafka突然积压100万条消息，消费者若全部拉取会导致下游服务OOM。
方案：消费者端用漏斗，将拉取速率限制为1000条/s，给下游留有处理喘息空间。

场景四：防止恶意刷票/点击

问题：用户投票接口，恶意脚本瞬间发起10万次请求。
方案：按用户IP维度使用漏斗，容量20，漏出速率2/s。即使瞬间刷爆，也只会处理20个，其余全部丢弃，保证投票公正性。

6. 漏斗算法的缺陷与变种

缺陷	解决方案
面对突发流量，大量请求被丢弃，体验差（如秒杀）。	改为令牌桶允许一定突发，或使用滑动窗口兼顾公平。
队列积压导致请求延迟过高（超过客户端超时）。	设置队列容量不宜过大（如`容量 = 漏出速率 * 最大容忍延迟秒数`）。
单机漏斗无法应对分布式集群。	使用 Redis + Lua 实现分布式漏斗，或采用 Sentinel / Hystrix 的集群限流。

7. 分布式漏斗实现（Redis + Lua 伪代码）

Lua 复制代码

-- 漏斗 key: user_id, capacity: 100, leak_rate: 10/s
local key = KEYS[1]
local now = tonumber(ARGV[1])
local capacity = tonumber(ARGV[2])
local leak_rate = tonumber(ARGV[3])

-- 获取上次访问时间和剩余水量
local last_time = redis.call('hget', key, 'last_time') or now
local water = redis.call('hget', key, 'water') or 0

-- 计算漏掉的水量
local leak = (now - last_time) * leak_rate / 1000
water = math.max(0, water - leak)

-- 判断容量
if water < capacity then
    redis.call('hset', key, 'water', water + 1)
    redis.call('hset', key, 'last_time', now)
    return 1  -- 允许
else
    return 0  -- 拒绝
end

在Java中通过 Jedis 或 Lettuce 调用此脚本，实现集群下的精确限流。

总结建议

纯内部系统保护 （要求输出绝对平滑）→ 用 漏斗（队列 + 定时器）。
对外网关/API （允许轻微突发，追求低延迟）→ 用 令牌桶（Guava RateLimiter）。
分布式场景 → 用 Redis + Lua 实现的漏斗或令牌桶。
记住黄金法则 ：漏斗容量 = 漏出速率 * 可容忍的最大排队延迟，过大会导致请求超时无效，过小则丢弃过多。

Java 漏斗算法 及应用场景

1. 核心原理（与令牌桶的区别）

2. Java 代码实现（基于队列 + 定时任务）

3. 简化实现（计数器版本）------ 不推荐

4. 工业级实现推荐（Guava RateLimiter）

5. 真实应用场景详解

场景一：保护数据库写入（削峰填谷）

场景二：外部API调用（第三方限流）

场景三：消息队列消费平滑

场景四：防止恶意刷票/点击

6. 漏斗算法的缺陷与变种

7. 分布式漏斗实现（Redis + Lua 伪代码）

总结建议

Java 漏斗算法及应用场景