Java项目中Redis热点Key自动检测方案详细教程

一、背景：为什么需要热点Key自动检测

1.1 热点Key引发的风险

在高并发场景下，Redis热点Key是一个经常被忽视却危害巨大的问题。当某个Key的访问量突然激增时，它所在的Redis分片会承受远超预期的请求压力。由于Redis是单线程结构，所有请求会排队等待处理------当请求量远超处理能力时，后续请求会陷入等待和超时，最终导致该分片上的所有其他数据操作都无法继续提供服务。

举个例子。某电商平台大促期间，一个爆款商品ID可能瞬间带来每秒百万级的请求。即便这些流量只在几秒内消退，也足以让对应的Redis分片集群瘫痪。热Key不仅影响自身，还会"连累"和它处在同一分片上的所有其他数据，造成缓存击穿，请求进一步穿透到数据库，最终引发数据库雪崩。

纯本地缓存方案虽然能解决这个问题，但本地内存有限，无法缓存全部数据；各节点各自为战，又从全局视角难以判断哪些Key真正属于热点。因此，业界迫切需要一套自动化的热点Key探测方案。

1.2 热点Key的传统识别方法（局限与不足）

在实际排查热点Key问题时，以下几种方法是早期常用的手段，但它们各有明显的局限性：

方法	操作方式	主要局限
`redis-cli --hotkeys`	执行`redis-cli -h <address> -p <port> -a <password> --hotkeys`	需要Redis 4.0以上且淘汰策略设为LFU；需扫描整个Keyspace，实时性差，Key数量多时耗时较长
`MONITOR`命令	实时抓取Redis服务器接收的命令，配合工具分析	高并发下内存暴增，严重降低Redis性能，只能用于紧急情况的短暂使用
慢日志分析	通过`SLOWLOG`查看执行时间较长的命令	无法识别大量耗时短但频率高的请求，覆盖范围有限
业务代码埋点	在应用中记录每个Key的访问次数	开发成本高，对业务有侵入性，需要额外的汇总计算平台

这些方法要么影响线上性能，要么实时性不足、要么改造成本高昂，难以满足自动化运维的需求。正是在这样的背景下，业界开始探索更优雅的解决方案：基于LFU的内置探测 、客户端侧探测定制框架 ，以及云平台原生支持等方案应运而生。我们将在后续章节逐一展开。

二、热点Key自动检测方案全景

目前业界主流的热点Key自动检测方案可以分为三大类，每类方案的适用场景和侧重点各不相同。

2.1 Redis原生LFU方案（最轻量）

从Redis 4.0开始，Redis内置了基于LFU（Least Frequently Used）的热点Key发现机制。LFU为每个Key维护一个计数器，每次Key被访问时计数器增大，计数器越大代表访问越频繁。

Redis使用对象中的24 bit空间来记录LFU信息：高16位记录访问时间（分钟级），低8位记录访问频率。有趣的是，低8位的counter并非简单的线性计数器，而是基于概率的对数计数器------通过概率因子控制增长速率，最大值为255。这意味着一个Key只需被大量访问就能达到高位，而少量访问则增长缓慢，非常适合在大规模流量中区分热点和普通Key。

配合redis-cli --hotkeys命令，可以快速扫描出实例中的热点Key。该命令通过向Redis-server节点发送SCAN + OBJECT FREQ命令，遍历分析实例中的所有Key。

2.2 客户端侧探测定制框架（最强大）

当内置方案难以满足超大规模场景时，大厂普遍选择自研客户端侧探测框架。京东开源的JDHotKey 和有赞的TMC是其中的代表。

JDHotKey采用分布式架构，核心在于统一收集各应用节点的访问数据。客户端SDK上报待测Key，Worker集群进行分布式计算，当某个Key达到设定的阈值后，结果会推送给所有客户端节点进行本地缓存。这套框架历经2020年京东618和双11的考验，平时每天探测Key数量数十亿计，大促期间Worker集群秒级吞吐量达到1500万级别。

有赞的TMC遵循类似的思路：数据收集 → 热度滑窗 → 热度汇聚 → 热点探测的四步流程，通过时间轮记录30秒时间窗口内的访问热度，最终选出TopN热点Key推送给客户端。

2.3 云服务商内置方案（最省心）

对于使用云服务的用户，各大云厂商也提供了开箱即用的热点Key分析能力。阿里云的Tair/Redis控制台提供实时Top Key统计与离线全量Key分析功能，通过分析Redis备份文件展示实例中的大Key详情，同时支持实时展示热Key信息。云平台通常通过审计日志即可直接查询热点Key，对线上业务的影响极小。

下面用一个表格来对比这三种方案的特点：

方案类型	代表技术	优势	不足
Redis原生LFU	`redis-cli --hotkeys`、`OBJECT FREQ`	零侵入，无需额外部署	实时性差，需扫描全库
客户端框架	JDHotKey、有赞TMC	实时性强，毫秒级推送，准确度高	架构复杂，需部署多组件
云平台方案	阿里云Tair、华为云DCS	完全托管，对业务影响极小	绑定云厂商，成本较高

选择哪种方案，取决于你的业务规模、技术栈和可投入的运维成本。如果只是中小规模应用且使用云服务，云平台内置功能最为省心；如果是大流量场景且有专门的中间件团队，客户端框架能提供最强大的实时探测能力；而Redis原生方案则适合作为辅助排查手段。

三、方案一：基于Redis LFU的热点Key自动检测

3.1 LFU原理与配置

要在Redis中使用LFU进行热点Key检测，首先需要将Redis的淘汰策略设置为LFU相关模式。Redis 4.0及以上版本支持volatile-lfu（仅对设置了过期时间的Key）和allkeys-lfu（对所有Key）两种LFU淘汰策略。

在redis.conf中配置：

复制代码

# 设置淘汰策略为allkeys-lfu
maxmemory-policy allkeys-lfu

# 调整LFU对数计数器的概率因子（默认10）
# 值越大，counter增长越慢，更适应高频访问场景
lfu-log-factor 10

# 调整LFU计数器衰减时间（默认1分钟）
# 每隔lfu-decay-time分钟，counter会衰减一次
lfu-decay-time 1

配置生效后，Redis会自动为每个Key维护一个对数计数器。访问越频繁的Key，计数器的值越高。

3.2 Java实现：自动扫描热点Key

以下是一个完整的Java实现示例，展示如何通过jedis客户端定期扫描Redis实例，自动识别热点Key：

复制代码

import redis.clients.jedis.Jedis;
import redis.clients.jedis.ScanParams;
import redis.clients.jedis.ScanResult;
import java.util.*;
import java.util.concurrent.Executors;
import java.util.concurrent.ScheduledExecutorService;
import java.util.concurrent.TimeUnit;

/**
 * 基于Redis LFU的热点Key自动检测工具
 */
public class RedisLFUHotKeyDetector {
    private final Jedis jedis;
    private final int hotKeyThreshold;      // 热点键阈值
    private final ScheduledExecutorService scheduler;
    
    public RedisLFUHotKeyDetector(String host, int port, int hotKeyThreshold) {
        this.jedis = new Jedis(host, port);
        this.hotKeyThreshold = hotKeyThreshold;
        this.scheduler = Executors.newScheduledThreadPool(1);
    }
    
    /**
     * 启动定期扫描任务
     * @param intervalSeconds 扫描间隔（秒）
     */
    public void startScanning(int intervalSeconds) {
        scheduler.scheduleAtFixedRate(() -> {
            try {
                scanAndReportHotKeys();
            } catch (Exception e) {
                System.err.println("HotKey scan failed: " + e.getMessage());
            }
        }, 0, intervalSeconds, TimeUnit.SECONDS);
    }
    
    /**
     * 扫描全量Key，根据OBJECT FREQ值识别热点Key
     */
    private void scanAndReportHotKeys() {
        String cursor = ScanParams.SCAN_POINTER_START;
        ScanParams scanParams = new ScanParams().count(1000);
        Map<String, Long> hotKeys = new HashMap<>();
        
        do {
            ScanResult<String> scanResult = jedis.scan(cursor, scanParams);
            List<String> keys = scanResult.getResult();
            cursor = scanResult.getCursor();
            
            for (String key : keys) {
                try {
                    // 通过OBJECT FREQ命令获取LFU计数器的值（0-255）
                    Long freq = jedis.objectFreq(key);
                    if (freq != null && freq >= hotKeyThreshold) {
                        hotKeys.put(key, freq);
                        System.out.println("Detected hot key: " + key + ", freq=" + freq);
                    }
                } catch (Exception e) {
                    // 某些Key类型可能不支持OBJECT FREQ命令
                }
            }
        } while (!cursor.equals(ScanParams.SCAN_POINTER_START));
        
        // 对热点Key按频率排序
        List<Map.Entry<String, Long>> sorted = new ArrayList<>(hotKeys.entrySet());
        sorted.sort((a, b) -> b.getValue().compareTo(a.getValue()));
        
        System.out.println("Top 10 Hot Keys: " + sorted.stream().limit(10).toList());
        // 可在此处将热点Key列表推送到监控系统或配置中心
    }
    
    public void stop() {
        scheduler.shutdown();
        jedis.close();
    }
    
    // 使用示例
    public static void main(String[] args) {
        RedisLFUHotKeyDetector detector = new RedisLFUHotKeyDetector("localhost", 6379, 200);
        detector.startScanning(60);  // 每60秒扫描一次
    }
}

3.3 优缺点分析

优点：无需额外部署组件，对业务代码零侵入，适合中小规模场景的快速排查。

缺点：需要扫描全库Key，当Key数量达到百万级时，一次扫描可能耗时数秒甚至更久；实时性较差，无法捕捉秒级突发热点；返回的OBJECT FREQ值是对数近似值，不能直观反映绝对访问次数。

适用场景：Key数量可控（通常在10万以内），对实时性要求不高的辅助性监控场景。

四、方案二：基于滑动窗口的自主探测实现

当不想引入复杂的第三方框架，但又需要比LFU扫描更好的实时性时，可以基于滑动窗口算法自行实现一套轻量级的热点探测系统。

4.1 滑动窗口+时间轮算法

滑动窗口算法的核心思想是：为每个Key维护一个固定时间窗口内的访问计数器，窗口随时间向前滑动，自动淘汰过期的计数数据。时间轮是实现这种滑动窗口的常用数据结构------

算法图解：

复制代码

时间线： ──[过去30秒]──[当前时刻]──→

时间轮示例（10个时间片，每片3秒）：
┌─────┬─────┬─────┬─────┬─────┬─────┬─────┬─────┬─────┬─────┐
│ 片0 │ 片1 │ 片2 │ 片3 │ 片4 │ 片5 │ 片6 │ 片7 │ 片8 │ 片9 │
└─────┴─────┴─────┴─────┴─────┴─────┴─────┴─────┴─────┴─────┘
  ←───────────── 30秒时间窗口 ─────────────→
         (10个时间片 × 3秒)

时间轮中维护了10个时间片，每个时间片记录该Key在对应3秒周期内的总访问次数，10个时间片的累加即为30秒滑动窗口内的总访问热度。当时间推移时，只需滑动时间轮的起始位置，用最新时间片覆盖最旧时间片。

这种设计可以保证窗口内的计数始终是最近一定时间内的有效数据，精准捕捉突发性热点。

4.2 核心数据结构设计

时间轮的热Key计数器可以用以下Java结构实现：

复制代码

import java.util.concurrent.ConcurrentHashMap;
import java.util.concurrent.atomic.AtomicLong;
import java.util.concurrent.locks.ReentrantReadWriteLock;

/**
 * 滑动窗口时间轮 - 用于统计Key的访问频率（基于桶的设计）
 */
public class SlidingWindowCounter {
    // 在无第三方依赖的情况下，可基于桶实现滑动窗口
    // 真实的生产场景建议使用更成熟的时间轮框架（如Netty的HashedWheelTimer）
    private final int windowSize;       // 窗口大小（秒）
    private final int bucketCount;      // 桶数量
    private final long bucketDuration;  // 每个桶的时间跨度（毫秒）
    private final AtomicLong[] buckets;
    private final ReentrantReadWriteLock lock = new ReentrantReadWriteLock();
    private volatile long lastUpdateTime;  // 上次滑动时间（毫秒）
    
    public SlidingWindowCounter(int windowSize, int bucketCount) {
        this.windowSize = windowSize;
        this.bucketCount = bucketCount;
        // 为了示例，假设windowSize = 30，bucketCount = 10，每个桶3秒
        this.bucketDuration = (windowSize * 1000L) / bucketCount;
        this.buckets = new AtomicLong[bucketCount];
        for (int i = 0; i < bucketCount; i++) {
            buckets[i] = new AtomicLong(0);
        }
        this.lastUpdateTime = System.currentTimeMillis();
    }
    
    /**
     * 记录一次访问
     */
    public void increment() {
        slideIfNecessary();
        // 获取当前时间所在的桶索引
        int currentBucket = getCurrentBucketIndex();
        buckets[currentBucket].incrementAndGet();
    }
    
    /**
     * 获取滑动窗口内的总访问次数（即所有桶之和）
     */
    public long getTotalCount() {
        slideIfNecessary();
        long total = 0;
        try {
            lock.readLock().lock();
            for (AtomicLong bucket : buckets) {
                total += bucket.get();
            }
        } finally {
            lock.readLock().unlock();
        }
        return total;
    }
    
    private void slideIfNecessary() {
        // 检查时间是否已经滑动到新的桶区间
        // 实现略：需要计算当前时间对应的桶索引，重置过期桶
    }
    
    private int getCurrentBucketIndex() {
        long now = System.currentTimeMillis();
        return (int) ((now / bucketDuration) % bucketCount);
    }
}

上述实现展示了基于多桶滑动窗口的核心思路。当然，在真实的生产场景中，直接基于上述实现进行大规模热点检测会面临几方面挑战：每个Key对应一个时间轮实例，内存消耗会随被监测的Key数量线性增长；多线程环境下的锁竞争可能成为性能瓶颈；滑动窗口的时间推进和桶重置逻辑需要精确的并发控制。

因此，对于生产环境的大流量场景 ，更推荐使用成熟的时间轮框架（如Netty的HashedWheelTimer）来替代手写实现，或直接采用下一节介绍的京东JDHotKey等业界已验证的开源方案。

4.3 基于Redis有序集合的简化实现

如果需要更快速的简易实现，也可以利用Redis自身的ZSET（有序集合）来模拟滑动窗口：

复制代码

import redis.clients.jedis.Jedis;
import redis.clients.jedis.Tuple;

import java.util.Set;

/**
 * 基于Redis ZSET的时间窗口计数器
 * 思路：使用ZSET存储Key的访问时间戳，通过时间范围筛选窗口内的访问记录
 */
public class RedisZSetHotKeyCounter {
    private final Jedis jedis;
    private final long windowSeconds;   // 时间窗口长度（秒）
    private final int threshold;        // 热点阈值
    
    public RedisZSetHotKeyCounter(String host, int port, long windowSeconds, int threshold) {
        this.jedis = new Jedis(host, port);
        this.windowSeconds = windowSeconds;
        this.threshold = threshold;
    }
    
    /**
     * 记录一次Key的访问
     */
    public void recordAccess(String key) {
        long timestamp = System.currentTimeMillis() / 1000;
        // 维护一个独立的ZSET（以key为标识），存储访问时间戳
        String zsetKey = "hotkey:counter:" + key;
        // 添加当前时间戳作为成员，score也是时间戳
        jedis.zadd(zsetKey, timestamp, String.valueOf(timestamp));
        // 移除窗口外的过期数据，保持集合不无限增长
        long cutoff = timestamp - windowSeconds;
        jedis.zremrangeByScore(zsetKey, 0, cutoff);
        // 设置过期时间，避免无访问的key长期占内存
        jedis.expire(zsetKey, windowSeconds + 60);
    }
    
    /**
     * 判断某个Key是否为热点Key
     */
    public boolean isHotKey(String key) {
        long timestamp = System.currentTimeMillis() / 1000;
        long cutoff = timestamp - windowSeconds;
        String zsetKey = "hotkey:counter:" + key;
        // 获取窗口内的访问次数
        Long count = jedis.zcount(zsetKey, cutoff, timestamp);
        return count != null && count >= threshold;
    }
    
    /**
     * 批量获取Top N热点Key（需要额外维护全局有序集合，此处略）
     */
    // ...
}

4.4 优缺点分析

优点：高度可控，可以根据业务需求灵活调整算法参数（窗口大小、统计精度）；无需额外部署外部服务。

缺点：单机模式下内存开销随被监测Key数量线性增长，大规模场景下压力较大；需要自行处理分布式汇总问题（参考JDHotKey的Worker分布式计算）。

适用场景：中小规模系统、用于验证和原型设计的场景。

五、方案三：京东开源JDHotkey实战（大厂首选）

对于真正高并发、大规模的线上系统，JDHotKey是业界经过海量流量验证的最成熟方案之一。它由京东零售开源，历经618、双11大促考验。

5.1 架构概述

JDHotKey由四个核心组件构成：

组件	职责	部署形式
etcd集群	高性能配置中心，存放规则、Worker地址、热点Key列表	独立部署
Client（SDK）	业务应用内嵌jar，完成Key上报、监听变更、本地Caffeine缓存	内嵌应用
Worker集群	核心计算节点，接收各Client上报的Key，进行分布式累加计算	独立Java进程
Dashboard	可视化控制台，管理规则配置、查看热点统计	独立Java进程

工作流程如下：

Client端将待测Key上报给Worker集群（通过Netty长连接）
Worker根据Key的哈希值分发到对应的计算节点
Worker读取etcd中的规则（如"2秒内出现20次算热Key"）
当Key访问次数达到阈值，Worker将热Key推送到etcd并广播给所有Client
Client收到热Key后，自动将其加入本地Caffeine缓存
Dashboard监听热Key信息进行入库和可视化展示

5.2 环境搭建与部署

步骤1：安装etcd（3.4.x以上版本）

复制代码

# 下载etcd
wget https://github.com/etcd-io/etcd/releases/download/v3.5.9/etcd-v3.5.9-linux-amd64.tar.gz
tar -xzf etcd-v3.5.9-linux-amd64.tar.gz
cd etcd-v3.5.9-linux-amd64

# 启动etcd服务
./etcd --listen-client-urls http://0.0.0.0:2379 \
       --advertise-client-urls http://0.0.0.0:2379

步骤2：启动Worker集群

从Gitee下载源码并编译：

复制代码

git clone https://gitee.com/jd-platform-opensource/hotkey.git
cd hotkey/hotkey-worker
mvn clean package

# 启动Worker（可部署多台）
java -jar -Dserver.port=8091 worker-0.0.1-SNAPSHOT.jar \
    --etcd.server=http://etcd-host:2379 \
    --threadCount=8 \
    --workerPath=app-product

主要配置项说明：

etcd.server：etcd集群地址，多个地址用逗号分隔
threadCount：处理Key的计算线程数，根据CPU核心数调整
workerPath：应用标识，不同应用使用不同的worker进行资源隔离

步骤3：启动Dashboard控制台

复制代码

cd hotkey/hotkey-dashboard
# 创建MySQL数据库并导入db.sql
mysql -u root -p < resource/db.sql

# 修改application.yml中的数据库和etcd地址
vim src/main/resources/application.yml

# 启动Dashboard
mvn spring-boot:run

启动后访问http://localhost:8081，登录Dashboard（默认用户名和密码可在配置文件中设置），在控制台中配置规则，例如：设置product__前缀的Key在2秒内出现20次即判定为热Key，并在本地缓存60秒。

步骤4：Client端引入依赖

在业务项目的pom.xml中添加：

复制代码

<dependency>
    <groupId>com.jd.platform</groupId>
    <artifactId>hotkey-client</artifactId>
    <version>1.0.0</version>
</dependency>

5.3 Java接入代码示例

初始化HotKey（通常在Spring Boot的启动类中）：

复制代码

import com.jd.platform.hotkey.client.ClientStarter;
import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;
import javax.annotation.PostConstruct;

@SpringBootApplication
public class Application {
    
    @PostConstruct
    public void initHotkey() {
        ClientStarter.Builder builder = new ClientStarter.Builder();
        // etcd地址
        builder.setEtcdServer("http://etcd-host:2379")
               // 应用名称，需与Dashboard中配置的APP一致
               .setAppName("product-service")
               // 本地Caffeine缓存最大条目数
               .setCaffeineCacheSize(10000)
               .build();
    }
    
    public static void main(String[] args) {
        SpringApplication.run(Application.class, args);
    }
}

业务代码中使用热点探测：

复制代码

import com.jd.platform.hotkey.client.HotKeyClient;
import org.springframework.stereotype.Service;

@Service
public class ProductService {
    
    public String getProductDetail(String productId) {
        // 构建完整的Key（与Dashboard中配置的前缀规则对应）
        String fullKey = "product__" + productId;
        
        // 方法1：判断是否为热Key，并自动上报统计数据
        if (HotKeyClient.isHotKey(fullKey)) {
            // 热Key：优先从本地Caffeine缓存获取
            String cached = HotKeyClient.get(fullKey);
            if (cached != null) {
                return cached;
            }
        }
        
        // 冷Key或本地缓存未命中：从Redis获取
        String value = redisGet(productId);
        
        // 如果是热点场景，可能需要根据业务逻辑决定是否手动写入缓存
        if (value != null && HotKeyClient.isHotKey(fullKey)) {
            HotKeyClient.set(fullKey, value, 60);
        }
        
        return value;
    }
    
    private String redisGet(String productId) {
        // 实际Redis读取逻辑
        return "product detail for " + productId;
    }
}

HotKeyClient提供的主要API：

方法	说明
`boolean isHotKey(String key)`	判断Key是否为热Key，同时将Key上报到Worker集群进行计算
`Object get(String key)`	从本地Caffeine缓存中获取值
`void set(String key, Object value, int expireSeconds)`	设置本地缓存
`void remove(String key)`	手动移除本地缓存中的指定Key

注意：isHotKey方法在返回结果的同时，会将该Key上报给Worker进行计数。因此对于非热Key的访问（即isHotKey返回false但业务仍需处理的场景），虽然调用本身能完成上报，但建议在业务主流程中统一调用，以免漏报导致探测失准。同时，client内部的本地缓存基于Caffeine实现，可根据业务需求调整maximumSize参数控制内存占用。

5.4 最佳实践建议

规则配置：根据业务特点在Dashboard中配置不同的规则。例如大促期间调低阈值，提前识别潜在热点。
前缀设计 ：使用统一的前缀对Key进行分组管理，如product__xxx、user__xxx，便于在Dashboard中配置前缀匹配规则。
本地缓存管理：合理设置本地缓存容量（Caffeine的maximumSize）和过期时间（expireAfterWrite），平衡内存占用与命中率。
集群部署 ：建议将Worker部署在多台机器上形成负载均衡，workerPath用于区分不同业务组，避免资源竞争。

5.5 性能表现

JDHotKey在高并发场景下表现优异：8核单机Worker端每秒可接收处理16万个Key探测任务，16核单机至少平稳处理30万以上，实际压测达到每秒37万次。在大促期间，由热Key探测产生的本地缓存占应用总访问量的50%以上，有效减轻了Redis层一半以上的负担。

六、优化策略与生产落地最佳实践

6.1 防止缓存击穿

当热点Key的缓存失效时，瞬间大量请求会同时穿透到数据库，造成"缓存击穿"。可以使用Redis的原子操作配合双重检查锁来避免：

复制代码

import org.springframework.data.redis.core.StringRedisTemplate;
import org.springframework.data.redis.core.script.DefaultRedisScript;
import java.util.Collections;
import java.util.concurrent.TimeUnit;

@Service
public class CacheService {
    @Autowired
    private StringRedisTemplate redisTemplate;
    
    // 使用Lua脚本实现原子性获取缓存
    private static final String LUA_GET_OR_SET = 
        "local val = redis.call('get', KEYS[1]) " +
        "if val then return val " +
        "else " +
        "   local newVal = redis.call('set', KEYS[1], ARGV[1], 'EX', ARGV[2]) " +
        "   return newVal " +
        "end";
    
    public String getOrLoad(String key, String dbValue, long expireSeconds) {
        DefaultRedisScript<String> script = new DefaultRedisScript<>(LUA_GET_OR_SET, String.class);
        String result = redisTemplate.execute(script, Collections.singletonList(key), dbValue, String.valueOf(expireSeconds));
        if (result == null) {
            // 缓存未命中，从数据库加载
            return loadFromDB(key);
        }
        return result;
    }
}

6.2 热点Key的分片策略

当热点Key无法避免时，可以采用"逻辑分片"的方式将热点打散。例如对于商品库存这类极易成为热点的数值型Key，不将库存存放在一个Key中，而是拆分为多个分片：

复制代码

/**
 * 热点分片方案：将一个Product的库存拆分为多个分片
 * 例如使用商品ID的最后两位作为分片索引，将请求分散到10个不同的Key上
 */
@Service
public class HotKeyShardingService {
    private static final int SHARD_COUNT = 10;
    
    /**
     * 获取某个商品的库存总量（读操作）
     */
    public int getStock(String productId) {
        int totalStock = 0;
        for (int i = 0; i < SHARD_COUNT; i++) {
            String shardKey = "stock:" + productId + ":" + i;
            totalStock += Integer.parseInt(redisGet(shardKey));
        }
        return totalStock;
    }
    
    /**
     * 扣减库存（写操作）- 只需要扣减其中一个分片
     * 随机选择一个分片进行扣减，将热点打散
     */
    public boolean decrStock(String productId) {
        int shardIndex = Math.abs(productId.hashCode()) % SHARD_COUNT;
        String shardKey = "stock:" + productId + ":" + shardIndex;
        Long stock = redisTemplate.opsForValue().decrement(shardKey);
        if (stock != null && stock >= 0) {
            // 扣减成功，如果扣减后该分片仍为正数，其他分片不受影响
            return true;
        } else {
            // 当前分片库存不足，尝试其他分片或兜底处理
            return tryOtherShards(productId, shardIndex);
        }
    }
}

除了逻辑分片，还可以采用以下策略进一步缓解热点压力：

读写分离：如果热点来自读请求，通过增加从节点来分担读压力
二级缓存：在应用层引入多级缓存架构，热点数据优先从本地缓存获取，减少Redis层的直接冲击

6.3 定期治理与兜底逻辑

定期扫描过期热Key：通过定期任务检查热Key是否已不再"热"，及时从本地缓存中清除；
逃逸流量限制：在热点探测框架前设置限流屏障，确保突发流量不会压垮探测服务本身；
降级预案：准备兜底返回逻辑（如默认值或静态页面），当缓存全面失效时保证核心业务可用。

七、总结与选型建议

场景	推荐方案	理由
中小规模系统，Key数量 < 10万	Redis原生LFU + 定时扫描（见第三、四章）	成本低，实现简单，无需引入额外组件
大促秒杀等高并发场景	京东JDHotKey（第五章）	业界验证过的大规模实践，毫秒级探测推送，性能优异
有预算的云上用户	云平台内置方案（2.3节）	开箱即用，全托管运维成本最低
需要深度定制探测逻辑	滑动窗口算法自主实现（第四章）	完全可控，可针对业务特点灵活调整

核心思路是：让热Key进入JVM本地内存，避开Redis单线程的性能瓶颈。JDHotKey框架已经很好地解决了本地缓存的分布式一致性问题------通过etcd进行配置下发和热点同步，实现了自动化的热点检测与本地缓存管理。如果条件允许，直接使用JDHotKey是目前成本效益最佳的选择。

提示：JDHotKey的完整源码和使用文档可以在Gitee上找到：https://gitee.com/jd-platform-opensource/hotkey。在实际接入时，建议先在测试环境中充分验证，再逐步灰度上线生产流量。