秋招突击——第九弹——Redis缓存

文章目录

引言

  • 感觉进度还是不够快,然后方向有点乱,又是项目,又是八股,又是redis,做项目发现很多没有学过。本来放下了redis,准备直接做项目,结果看着看着,发现redis这里有不会。

正文

缓存基础

  • 将MySQL中的热点数据存储在Redis上,利用其访问高效的特点
    • 二八原则,百分之八十的流量建立在百分之二十的信息上。

怎么做

  • 采用服务端缓存,访问MySQL数据之后的将数据放在redis中进行缓存,下次直接访问redis

缓存的几种模式

  • 旁路缓存模式(Cache-Aside Pattern):这个用的最多
  • 读穿透模式
  • 写穿透模式
  • 异步缓存写入模式
旁路缓存模式(重点)
  • 应用服务直接将缓存当作数据的旁路,直接和缓存进行交互

  • 读取数据的流程

    • 读取数据先读取缓存,缓存中有,那就加载缓存
    • 缓存中没有读取数据库,然后将读取的数据放入缓存中
    • 会预先加载一批数据到缓存中。
  • 写数据流程

    • 直接更新数据库,然后删除缓存

如果不删除缓存,会出现时序性的问题

  • 更新修改数据库和修改缓存的顺序不一样。

  • 适用场景和缺点

    • 读多血少
    • 出现缓存和数据库不一致的情况
读穿透(了解)
  • 应用服务不在和缓存直接交互,而是直接访问数据服务(代理)
    • 由数据服务访问数据库和缓存,使用者不知道数据来源,数据服务会根据情况查询缓存或数据库

特点

  • 服务对于缓存是透明,代码更加简洁
  • 命中性能不如旁路缓存模式,还多了一次服务间调用。
写穿透(了解)
  • 一个缓存一个数据库,更新操作比较麻烦,先更新数据库,在删除缓存
    • 应用程序访问存储服务源,然后存储服务源完成对应的缓存和数据库操作


具体应用

  • 写穿透配合读穿透使用
  • 对缓存及时性要求高
  • 不能忍受丢失数据和数据不一致。
异步缓存写入模式
  • 同写穿透,不过先写缓存,然后异步写入数据库,

写入方式

  • 收集写操作,在数据库负载低的时候慢慢写入
  • 一个批量一块写入

优点

  • 降低了请求延迟,减轻了数据库复旦
  • 安全性不够,系统崩溃,内存数据会丢失
面试重点

Redis缓存是如何应用的

  • 旁路缓存,先查询redis,没有的话,再查MySQL,并将数据加载到Redis

Redis设置缓存用什么命令

  • set key value,如果业务要增加一个过期时间,可以使用ex参数,set key value ex 10;

聊聊旁路缓存模式下的查询流程

  • 请求到后台服务之后,先查redis,有就返回数据,没有就查Mysql,并将mysql的数据存入redis,最后返回给用户。

缓存异常场景

缓存穿透
  • 缓存和数据库中都没有的数据,而用户不断发起请求
    • 缓存是被动写的,也就是查不到就去数据库查,然后把数据插入到缓存中,现在就是每次都是查缓存,在数据库也查不到,缓存就被击穿了。
    • 有人频繁利用这类DB中没有的数据不断访问,系统会崩溃

解决方案

  • 接口层校验,对于访存数据做基础校验
  • 对于取不到的数据,设置为key-null,并设置有效时间较短,防止用户在短时间内反复用同一个id暴力攻击
  • 布隆过滤器 ,用于快速判定某一个元素是否在数据库中。
    • 将字符串通过hash函数映射到不同的二进制位置,并将该位置设置为1
    • 空间时间都很小,但是不完全准
缓存击穿
  • 缓存中没有,但是数据库中有的数据。
    • 某一瞬间并发用户特别多,同时读缓存没有读到数据,又同时去数据库读取数据,压力瞬间增加,崩溃

解决方案

  • 热点数据续期,对于持续访问的数据不断续期,避免过期失效被击穿
  • 进程加互斥锁,重建缓存
    • 线程查询缓存发现缓存不存在,尝试对线程加锁,拿到锁的线程访问数据库,并重建缓存,其他循环重试。
缓存雪崩
  • 大量的应用请求因为异常无法在Redis缓存中进行处理,像雪崩一样,直接打到数据库上。
  • 雪崩的原因
    • 数据大批量到过期时间
    • 查询数据量巨大,引起数据库压力过大,甚至宕机

和缓存击穿的区别

  • 缓存击穿是一条热点数据在Redis没有得到及时重建,
  • 缓存雪崩是一大批数据在Redis中同时失效

解决方案

  • 缓存过期时间设置随机,防止同一时间大量数据过期现象发生
  • 加互斥锁重建缓存
    • 当线程查询缓存发现数据不存在事,加锁,多个线程抢锁,拿到锁的线程查询数据库,重建缓存,失败则循环重试。
面试重点

缓存击穿和缓存穿透有什么区别

  • 击穿是单个热点数据在缓存中不存在,但是在数据库中存在,数据库被一瞬间的流量击垮的场景
  • 穿透是某个key不在数据库也不在缓存中,被海量击打

缓存雪崩和缓存击穿有什么区别

  • 缓存适量的数量,击穿是一个key失效,雪崩是大量的key 失效。

缓存击穿怎么解决

  • 热点数据续期
  • 加锁重建缓存,防止MySQL被击穿。

缓存一致性怎么保证?

缓存一致性问题是什么
  • 缓存是数据库的冗余存储,如果数据库信息更改了,缓存的数据和数据库不一致怎么办?
  • 解决办法
    • 更新MySQL即可,不管Redis,以过期时间兜底
    • 更新MySQL之后,操作Redis
    • 异步将MySQL更新同步到Redis

仅仅更新MySQL,不管Redis,过期时间兜底

  • 仅仅更新MySQL,等redis过期了,自动从MySQL重建更新,在这段时间内数据是不一致的。
    • 时间太长,会产生很多脏数据
    • 时间太短,会出现缓存击穿

优点

  • redis原生接口,开发成本低,易于实现,直接使用ex
  • 管理成本低,出概率的问题较小

缺点

  • 完全依赖过期时间,时间太短容易造成缓存频繁失效,太长会有较长的时间不一致。

更新MySQL,立刻更新Redis

  • 除了使用过期时间进行兜底,还会将缓存数据直接删除,借此减少数据不一致的情况出现

优点

  • 想对方案一,达成最终一致性的延迟更小
  • 实现成本低,只是在方案一的基础上,增加了删除的逻辑

不足

  • 更新mysql成功,删除redis却失败,就退化为方案一
  • 在更新的时候需要额外操作redis,性能损耗

异步将MySQL更新到MySQL

  • 将消费服务作为mysql的一个salve,订阅mysql的binlog日志,解析日志的内容,在更新到redis中
    • 业务和数据访问完全解耦,redis更新对业务更加透明(阿里的canal组件)

优点

  • 和业务完全解耦,在更新mysql是,不需要额外操作
  • 无时序性问题,可靠性抢。

缺点

  • 成本高,引入了消息队列,还需要搭建同步服务。
  • 服务崩溃了,redis没法更新。
方案选型
  • 时效性要求很高,一致性要求很高,不要使用缓存
  • 通常来说,使用过期兜底是行之有效的方式,还可以增加一个删除,增加时效性。
  • 解耦层面,使用方案三。
面试重点

缓存一致性问题是什么?

  • MySQL数据更新了,redis作为缓存,数据应该怎么保存一致性的问题。

redis做旁路缓存,如果mysql更新了,该何去何从

  • 在项目中使用过期时间来兜底,并在更新DB后,增加删除操作提升一致性的问题。
  • 设计方案的时候,考虑过订阅binlog日志的方式,会成本高,并且代码复杂。

什么情况下,适合订阅binlog方式

  • 这种模式更像是同步数据,比较适合缓存很长时间过期、或者不过期的场景,如果一个视频网站,有几个视频流量很大,基本不会动,是稳定的,可以使用这种方式。

分布式锁

分布式锁是什么?

  • 针对某项资源使用权限的管理,用来控制共享资源。

分布式锁

  • 在分布式场景下的锁,多台不同机器上的进程,去竞争同一项资源。
分布式锁有什么特性?

互斥性

  • 只让一个竞争者持有锁,其他进程无法持有。

安全性

  • 避免锁因为异常永远无法释放
    • 一个进程因为异常在持有锁的时候崩溃了,所拥有的锁能够被兜底释放,保证后续其他的竞争者也能够获得锁。

对称性

  • 同一个锁,加锁和解锁的必须要是用一个进程
    • 不能把其他竞争者持有的锁释放了

可靠性

  • 有一定程度的处理能力和容灾能力
分布式锁常用的方式什么?
最简化版本
  • 使用setnx实现,因为setnx是在变量不存在的时候,设置一个新的变量,并返回1,如果变量存在,就返回0。
    • 设置一个lock变量,每一次进程访问时候,就声明这个变量,操作完成之后,在删除变量,delete lock。在访问期间,其他线程通过setnx lock就会返回0,,无法访问,妙呀!
支持过期时间
  • 但是上述问题,存在一个问题,就是如果获取锁的某一个线程挂掉了,那么这个锁就石沉大海了,后续的所有线程都没有办法进行访问了。所以,需要增加一个过期时间来兜底。

setnx lock 1 ex limit-times

  • 即使获取锁的进程崩溃了,但是只要超过了limits-times,仍旧能够解锁,变量就过期了,其他进程仍旧能够获取锁。

但是仍旧存在一个问题,就是会出现其他进程删对应的锁的情况

增加owner字段
  • 分布式锁需要满足谁申请谁释放的原则,不能释放别人的锁,分布式锁要有归属
  • 在编程过程中,都是使用进程id作为锁的值
cpp 复制代码
set key owner(uuid) nx ex limit-seconds
  • 在获取锁的时候,会检查这个锁的值是不是自己的进程号,判定这个锁有没有变化。
引入Lua
  • 上述操作都不是原子性的,通过Lua将若干操作整合为原子操作。通过lua脚本,将若干操作合并成原子操作,保证结果的一致性 。
  • Lua是一个脚本

上述所有操作保证了对称性、安全性、互斥性

可靠性是如何保证的?
  • 上述所有方式都是针对单机模型而言的,如果redis挂了怎么办?常见方式有两种,分别是
    • 主从容灾
    • 多级部署
主从容灾
  • 为redis配置从节点,当主节点挂了,直接用从节点进行顶包。
    • 但是主从切换需要配置哨兵模式,实现主从节点自动切换,容纳灾祸


缺点

  • 主动节点数据同步需要时间,会丢掉部分数据
  • 分布式锁在失效的过程,会有多个机器同时获取执行权限
多机部署
  • 尝试多机部署,使用redis中的redlock
    • redlock:奇数个机器进行部署,然后半数以上的机器同意加锁才能成功,可靠性会向ETCD靠拢

具体执行流程

  • 有5个redis主节点,保证不会同时宕机,申请锁的时候,同时向5个主节点申请锁
  • 数量超过一半同意,获取锁,如果超过一半失败,向所有redis主节点发送解锁指令
  • 因为向五个节点发送锁请求,会有一个时间限制,如果在锁持有时间内,仍旧不能获取所有锁,就是失败。

优点

  • 增加灾难容错率,给运维进一步增加修复时间
  • 单点reids 的所有可靠性保持手段都可以使用,所以增加了可靠性
可靠性深究

没有完全可靠的分布式锁,NPC困境

N网络延迟

  • 当分布式锁获得返回包的时间过长,锁会很快就过期。
    • 锁剩余时间,减去请求时间,解决锁的网络延迟问题

P进程暂停

  • 进程在进行垃圾回收时,锁过期了,其他进程仍旧能够获得锁,两个进程就获得了同一个分布式锁。
  • GC的时间无法掌控,看门狗会随着GC而阻塞,也无法解决

C时钟漂移

  • 不同机器发生时间漂移,会出现同时获得一个锁的情况,无解。

具体来说,需要配合业务开展,不是完全可靠的

面试重点

分布式锁实现要点是什么?

  • 加锁的时候,要设置owner和过期时间
    • owner便于解锁的时候,进行拥有者的判断
    • 过期时间,对异常情况进行兜底
  • 解锁的时候,要先判断owner是否是自己,是自己在释放
    • 使用Lua脚本,保证操作的原子性

为什么要引入owner概念

  • 分布式锁需要保证对称性,谁加锁,就谁解锁
    • 具体情况说明,某一个服务执行时间太久,然后锁过期了,其他服务又获取了锁。

你提到Lua,Lua一定能够保证原子性吗?

  • Lua本身不具有原子性,通过Lua保证原子性是因为Redis是单线程执行的,一个线程放进Lua来执行,相当于打包再一次,redis执行的过程中,不会被其他请求打断

分布式锁是完全可靠的吗?

  • 没有完全可靠的分布式锁,关键业务需要靠幂等来兜底
  • 当然也可以使用redlock集群化的分布式锁,这种模式出问题的概率很低。

事物

事物是什么?
  • Mysql中的事物具有ACID原子特定,Redis不具有原子性和持久性。
  • 多个操作被看作是一个整体,也就是事物。事物通常具有原子性。
Multi事物
  • 通过multi关键字,进入多任务队列,执行对应的操作,后续所有输入的命令都会进入queue中
    • 使用exec指令,执行queue中的所有命令
    • 使用discard指令,丢弃最终的事物
    • 使用watch保证事物中的变量不会丢弃和改变。

multi事物具有原子性吗

  • 不具备,因为只是通过单线程的特性,其他操作切不进来
  • 但是因为中途自己崩溃,或者自己的问题只做一半,就没有意义了

multi事物的缺点

  • 弱原子性,事物开启之后每一个命令都是一次调用,浪费资源。
  • watch难用
  • 失败了还会继续执行,没意义
Lua做事物

Lua是什么

  • 标准C语言编写的轻量脚本语言
    • 目的是为应用程序提供扩展

Redis和Lua

  • redis通过内嵌支持lua环境,执行脚本的常用命令是eval
  • redis是单线程,处理过程中,不会被打断并切换到其他处理
    • redis执行lua脚本具有原子性

具体执行指令

cpp 复制代码
eval "return {redis.call('set' ,'ka','a1'),redis.call('icnr','ka')}"

优势

  • 可以编写if-else选择逻辑
  • 事物中间执行事变,会中断后续执行
  • 使用方便,开启lua就可以执行事物
Lua主要是redis中干什么的
  • 分布式锁和秒杀场景

消息队列

消息队列是什么?
  • 传递消息的队列
  • 用于
    • 异步流程、消息分发、流量削峰
  • 优点
    • 是实现高性能、高可用和高扩展的架构
      常见的消息队列中间件
  • Kafka,RabbitQ,MetaMQ等
redis能做消息队列吗
  • 可以,适合做一个轻量级的消息队列,常见的有三种方案

List做消息队列

  • 将数据放入list,消息作为商品,这就是一个典型的生产者和消费者模式。
    • 通过rpush和lpop实现消息的传递,但是这里不知道消息队列什么时候有消息,只能轮询

BRPOP和BLPOP

  • 没有消息在队列中,会陷入阻塞,阻塞时间内有消息,再继续执行。
  • 缺点
    • 没有ACK机制,消费失败了,还要放回去
    • 不支持多人消费

Pub/Sub生产订阅模式

  • 使用subscribe channel订阅消息频道
  • 使用publish channel msg往特定频道发送消息

缺点

  • 没有办法实现ACK功能
  • 不支持持久化,redis重启消息会全部丢失,若以pub和sub适合处理不重要的消息

Stream做消息队列

  • redis实现,具有持久化,消费组的功能,但是不考
几种方式对比

List:不需要ACK,不需要消费组,可以使用

PUB\SUB:不需要ACK,不需要持久化,可以用

STREAM:需要ACK,需要消费组,需要持久化,可用

秒杀

什么是秒杀
  • 一瞬间产生巨大流量的场景

需要注意以下几个问题

  • 海量请求,服务要抗住
  • 不能超卖
  • 避免少买
  • 保证触达是用户不是黄牛

没有相关的要求,直接跳过

场景应用面试题

实际使用redis做什么应用

  • 缓存和消息队列

redis缓存一般是如何使用的

  • 旁路缓存

redis做旁路缓存了,如果Mysql做了更新,该何去何从

  • 使用过期时间都低,更新DB之后,删除缓存

redis做秒杀场景可以吗

  • redis因为高性能,经常被用于做秒杀产经,预扣库存,结合Lua脚本,可以在一定程度上保证预扣库存的原子性

redis可以做消息队列吗

  • 可以,但是针对那种轻量级,不需要持久化,不需要ack的简单消息队列可以。

总结

  • 就剩限流器和秒杀没看了,感觉比较偏,我想去的并不是这一类服务,所以还是算了把,不看了,省时间。
  • 下面就是结合项目看一下项目的数据库怎么做的。
相关推荐
Fly不安全12 分钟前
Web安全:缓存欺骗攻击;基于缓存、CDN的新型Web漏洞
nginx·web安全·缓存·web·cdn·缓存欺骗攻击
明月看潮生16 分钟前
青少年编程与数学 02-007 PostgreSQL数据库应用 11课题、视图的操作
数据库·青少年编程·postgresql·编程与数学
阿猿收手吧!23 分钟前
【Redis】Redis入门以及什么是分布式系统{Redis引入+分布式系统介绍}
数据库·redis·缓存
奈葵26 分钟前
Spring Boot/MVC
java·数据库·spring boot
落霞的思绪27 分钟前
Redis实战(黑马点评)——涉及session、redis存储验证码,双拦截器处理请求
spring boot·redis·缓存
leegong2311135 分钟前
Oracle、PostgreSQL该学哪一个?
数据库·postgresql·oracle
中东大鹅40 分钟前
MongoDB基本操作
数据库·分布式·mongodb·hbase
夜光小兔纸1 小时前
Oracle 普通用户连接hang住处理方法
运维·数据库·oracle
Sunny_lxm1 小时前
<keep-alive> <component ></component> </keep-alive>缓存的组件实现组件,实现组件切换时每次都执行指定方法
前端·缓存·component·active
兩尛3 小时前
订单状态定时处理、来单提醒和客户催单(day10)
java·前端·数据库