2026.3.12 常见的缓存读写策略

这是我们日常开发中最常用、最经典的一种模式，几乎是互联网应用缓存方案的事实标准，尤其适合读多写少的业务场景。

这个模式之所以被称为"旁路"（Aside），是因为应用程序的写操作完全绕过了缓存，直接操作数据库。

下面我们来看一下这个策略模式下的缓存读写步骤。

写操作：

读操作：

绝对不能。如果这样做，在高并发的情况下会引入经典的数据不一致问题。

时序分析（请求A写，请求B读）
1. 请求A：先将Cache中的数据删除
2. 请求B：此时发现Cache中为空，则去DB中读旧数据，准备写入Cache
3. 请求A：将新值写入DB
4. 请求B：将之前读到的旧值写入Cache
结果：DB中是新值，Cache中是旧值，数据不一致。

也不是绝对安全。因为这样也可能会造成数据库和缓存数据不一致的问题。

时序分析（请求A写，请求B读）：
1. 请求B：发现Cache中为空，去DB中读旧数据，准备写入Cache
2. 请求A：迅速地更新完了DB中的旧数据，并执行删除Cache就数据操作
3. 请求B：慢悠悠地把旧数据写入Cache
结果：DB中最新值，而Cache中仍是旧值
为什么概率极小？这个问题本质上是一个并发时序问题：只要"读DB->写Cache"这段时间窗口内，恰好有写请求完成了DB更新，就有可能产生数据不一致。在大多数业务里，这个窗口时间相对较短，而且还需要与写请求并发"撞车"，所以发生概率不算高，但也不是绝无可能。

当然，这一切都建立在一个重要的前提之上：我们缓存的数据，是可以通过数据库进行确定性重建的，并且业务上可以容忍从"缓存删除"到"下一次读取并回填"之间这个极短时间窗口内的数据不一致。

现在让我们再分析一下Cache Aside Pattern的缺陷。

首次请求数据一定不在Cache的问题解决方法：对于访问量巨大的热点数据，可以在系统启动或低峰期进行缓存预热。
写操作比较频繁的话导致Cache中的数据被频繁删除，进而影响缓存命中率解决方法：
- 数据库和缓存数据强一致场景：更新DB的时候同时更新Cache，不过我们需要加一个分布式锁来保证更新Cache的时候不存在线程安全的问题。
- 可以短暂地允许数据库和缓存数据不一致的场景：更新DB的时候同时更新Cache，但是给缓存加一个比较短的过期时间（如1分钟），这样的话就可以保证即使数据不一致的话影响也会降到最低。

在这种模式下，应用程序将Cache视为唯一的、主要的存储。所有的读写请求都直接打向Cache，而Cache服务自身负责与DB进行数据同步。

对应用程序透明，应用开发者无需关心DB的存在。

这种缓存读写策略再平时开发过程中非常少见。抛去性能方面的影响，大概率是因为我们经常使用的分布式缓存Redis本身并没有提供Cache将数据写入DB的功能，需要我们在业务侧或中间件里自己实现。

Read-Through实际只是再Cache-Aside上进行封装。在Cache-Aside下，发生读请求的时候，如果Cache中不存在对应的数据，是由客户端自己负责把数据写入Cache，而Read Through是由Cache服务自己写入缓存，而这一切对客户端是透明的。

和Cache Aside一样，Read-Through 也存在首次请求数据的时候缓存未命中的问题，对于热点数据可提前放入缓存中。

Write Behing（也被称为Write-Back）Pattern和Read/Write Through Pattern很相似，两者都是由Cache服务来负责Cache和DB的读写。

但是，两者又有很大的不同：读写穿透是同步更新Cache和DB，而异步缓存写入则是只更新缓存，不直接更新DB，而是改为异步批量的方式来更新DB

这种模式对数据一致性带来了挑战（例如：Cache中的数据还没来得及写回DB，系统就宕机了），因此不适用于需要强一致性的场景（如交易、库存）。

但是，它的异步和批量特性，带来了无与伦比的写性能。它在许多高性能系统中都有广泛的应用：