缓存穿透问题与解决方案

缓存穿透问题详解

缓存穿透 是指查询一个根本不存在的数据。由于缓存（Redis）和数据库（MySQL）中都没有该记录，每次针对此数据的请求都会由于缓存未命中（Miss）而直接"穿透"到后端数据库。

如果在短时间内有大量此类恶意攻击或异常请求，数据库将承受巨大的瞬时压力，可能导致系统崩溃。

1. 核心流程与成因

正常情况下，缓存作为数据库的屏障拦截了大部分请求。但在缓存穿透场景下：

请求到达 ：用户查询一个 ID 为 -1 或随机生成的非法数据。
缓存失效：Redis 中没有该 ID 的记录。
透传数据库：请求直接查询数据库，结果依然为空。
循环往复：由于数据库结果为空，通常代码不会将此空结果写入缓存，导致下一次相同请求依然会穿透。

2. 解决方案

为了防止数据库被"穿透"，业界主要采用以下两种成熟方案：

方案一：缓存空对象（Cache Null Object）

这是最简单、最常用的方案。当数据库返回空结果时，依然将一个特殊的"空标记"或 null 写入缓存，并设置一个较短的过期时间。

优点：实现简单，维护成本低。
缺点：
- 消耗额外的内存空间（缓存了大量无意义的空键）。
- 可能导致短期的不一致（如果此时数据库刚好插入了该数据，缓存中可能依然存着空对象）。

java 复制代码

public Object queryData(String key) {
    // 1. 查缓存
    Object val = redis.get(key);
    if (val != null) return val;

    // 2. 查数据库
    Object dbVal = mapper.select(key);
    if (dbVal == null) {
        // 核心：即使为空也存入缓存，设置 2 分钟过期时间
        redis.setex(key, 2, TimeUnit.MINUTES, ""); 
        return null;
    }
    
    redis.set(key, dbVal);
    return dbVal;
}

方案二：布隆过滤器（Bloom Filter）

在进入缓存层之前，先通过布隆过滤器拦截非法请求。布隆过滤器是一种紧凑的概率性数据结构，用于快速判断一个元素是否在一个集合中。

核心逻辑：
- 如果布隆过滤器判断不存在 ，那么该数据一定不存在，直接拦截。
- 如果判断存在，数据可能存在（存在极小的误判率），允许通过去查缓存。
优点：内存占用极低，不需要存储具体的 Key。
缺点：
- 代码复杂度高，需要预热加载所有合法的 Key。
- 无法物理删除（数据从库中删除后，布隆过滤器难以实时同步移除）。