如何让MySQL 和 Redis 数据保持一致
今天在工作中遇到了这个问题,往MySQL中频繁的插入大量数据,一个用户生成一堆数据,另一个用户又生成一堆数据。这样对我们的数据库很不友好,那我们可以使用什么方式来解决?我想到了两个优化的方式,第一个使用分布式中消息队列和使用redis的缓存来解决。为了简单高效。这里用到redis中的缓存来实现,但是也会出现问题,其中的一个问题就是如何让MySQL 和 Redis 数据保持一致
?
使用过缓存的人都应该知道,在实际应用场景中,要想实时刻保证缓存和数据库中的数据一样,很难做到。
基本上都是尽可能让他们的数据在绝大部分时间内保持一致,并保证最终是一致的。
分析两个问题:
1、缓存不一致是如何产生的
如果数据一直没有变更,那么就不会出现缓存不一致的问题。
通常缓存不一致是发生在数据有变更的时候。因为每次数据变更你需要同时操作数据库和缓存,而他们又属于不同的系统,无法做到同时操作成功或失败,总会有一个时间差。在并发读写的时候可能就会出现缓存不一致的问题(理论上通过分布式事务可以保证这一点,不过实际上基本上很少有人这么做)。
虽然没办法在数据有变更时,保证缓存和数据库强一致,但对缓存的更新还是有一定设计方法的,遵循这些设计方法,能够让这个不一致的影响时间和影响范围最小化。
2、缓存更新的几种设计
①先删除缓存,再更新数据库(这种方法在并发下最容易出现长时间的脏数据,不可取)
②先更新数据库,删除缓存
③只更新缓存,由缓存自己同步更新数据库
④只更新缓存,由缓存自己异步更新数据库
2.1 先删除缓存,再更新数据库
缺点:这种方法在并发读写的情况下会出现缓存不一致的问题。
图来解释:
- 客户端A 触发更新数据A的逻辑
- 客户端B 触发查询数据A的逻辑
- 客户端A 删除缓存中数据A
- 客户端B 查询缓存中数据A,未命中
- 客户端B 从数据库查询数据A,并更新到缓存中
- 客户端A 更新数据库中数据A
可见,最后缓存中的数据 A 跟数据库中的数据 A 是不一致的,缓存中的数据A是旧的脏数据。
因此一般不建议使用。
2.2 先更新数据库,再让缓存失效
这种方法在并发读写的情况下,也可能会出现短暂缓存不一致的问题
图来解释:
如上图所示,其可能执行的流程顺序为:
- 客户端A 触发更新数据A的逻辑
- 客户端B 触发查询数据A的逻辑
- 客户端C 触发查询数据A的逻辑
- 客户端A 更新数据库中数据A
- 客户端B 查询缓存中数据A,命中返回(旧数据)
- 客户端A 让缓存中数据A失效
- 客户端C 查询缓存中数据A,未命中
- 客户端C 查询数据库中数据A,并更新到缓存中
可见,最后缓存中的数据A和数据库中的数据 A 是一致的,理论上可能会出现一小段时间数据不一致,不过这种概率也比较低,大部分的业务也不会有太大的问题。
2.3 只更新缓存,由缓存自己同步更新数据库
这种方法相当于是业务只更新缓存,再由缓存去同步更新数据库。
图来解释:
如上图所示,其可能执行的流程顺序为:
- 客户端A 触发更新数据 A 的逻辑
- 客户端B 触发查询数据 A 的逻辑
- 客户端A 更新缓存中数据 A,缓存同步更新数据库中数据 A,再返回结果
- 客户端B 查询缓存中数据 A,命中返回
Read Through 和 WriteThrough 的流程类似,只是在客户端查询数据A时,如果缓存中数据A失效了(过期或被驱逐淘汰),则缓存会同步去数据库中查询数据A,并缓存起来,再返回给客户端。
这种方式缓存不一致的概率极低,只不过需要对缓存进行专门的改造。
2.4 只更新缓存,由缓存自己异步更新数据库
这种方式性详单于是业务只操作更新缓存,再由缓存异步去更新数据库。看下图信息:
如上图所示,其可能的执行流程顺序为:
客户端A 触发更新数据 A 的逻辑
客户端B 触发查询数据 A 的逻辑
客户端A 更新缓存中的数据 A,返回
客户端B 查询缓存中的数据 A,命中返回
缓存异步更新数据 A 到数据库中
这种方式的优势是读写的性能都非常好,基本上只要操作完内存后就返回给客户端了,但是其是非强一致性,存在丢失数据的情况。
如果在缓存异步将数据更新到数据库中时,缓存服务挂了,此时未更新到数据库中的数据就丢失了。
总结
上面讲到的几种缓存更新的设计方式,都是前人总结出来的经验,这些方式或多或少都有一些弊端,并不完美,实际上也很难有完美的设计。大家在做系统设计的时候,也不要去追求完美,要有一些取舍,找到一种最适合自己业务场景的方式就行。加油!