Redis进阶学习
- 一、Redis事务
-
- [1.2 Redis监控](#1.2 Redis监控)
- [1.3 Jedis连接](#1.3 Jedis连接)
- [1.4 SpringBoot整合](#1.4 SpringBoot整合)
- [1.5 自定义RedisTemple](#1.5 自定义RedisTemple)
- [1.6 Redis.conf详解](#1.6 Redis.conf详解)
- [二、 Redis持久化](#二、 Redis持久化)
-
- [2.1 RDB](#2.1 RDB)
- [2.2 AOF进程](#2.2 AOF进程)
- 三、Redis发布订阅
-
- [3.1 Redis主从复制](#3.1 Redis主从复制)
- [3.2 集群环境配置](#3.2 集群环境配置)
- 3.3、复制原理
- 3.4、宕机后主动变为主机
- 3.5、哨兵模式
- 四、Redis缓存穿透和雪崩
一、Redis事务
Redis在单条命令
是保持原子性
的,但是事务
是不
保持原子性
的!
Redis事务本质:一组命令的集合! 一个事务当中的所有命令都会被序列化,在事务执行的过程中,会按照着顺序进行执行!
一次性、顺序性、 排他性! 执行一些列的命令!
Redisd的事务:
- 开启事务(MULTI)
- 命令入列(......)
- 执行事务(EXEC)
正常执行事务!!!!
bash
127.0.0.1:6379> set k1 v1
QUEUED
127.0.0.1:6379> set k2 v2
QUEUED
127.0.0.1:6379> getset k1 123
QUEUED
127.0.0.1:6379> get k1
QUEUED
127.0.0.1:6379> exec
1) OK
2) OK
3) "v1"
4) "123"
编译型错误,执行代码时就会报错,其他的代码也不会再次执行(因为代码写错了)
bash
127.0.0.1:6379> multi
OK
127.0.0.1:6379> set k1 v1
QUEUED
127.0.0.1:6379> set k2 v2
QUEUED
127.0.0.1:6379> getset k2 # 代码写出,所有的代码都不会执行
(error) ERR wrong number of arguments for 'getset' command
127.0.0.1:6379> set k3 v3
QUEUED
127.0.0.1:6379> set k4 v4
QUEUED
127.0.0.1:6379> get k4
QUEUED
127.0.0.1:6379> exec
(error) EXECABORT Transaction discarded because of previous errors.
127.0.0.1:6379> get k4 # 其他代码就没有执行
(nil)
运行时异常:如果事务队列当中存在语法性错误,那么在执行命令的时候,其他的命令也可以正常执行,错误的命令就抛出错误就行
bash
127.0.0.1:6379> multi
OK
127.0.0.1:6379> set k1 v1
QUEUED
127.0.0.1:6379> incr k1
QUEUED
127.0.0.1:6379> set k2 v2
QUEUED
127.0.0.1:6379> set k3 v3
QUEUED
127.0.0.1:6379> get k3
QUEUED
127.0.0.1:6379> exec
1) OK
2) (error) ERR value is not an integer or out of range # 抛出错误
3) OK
4) OK
5) "v3"
127.0.0.1:6379> get k3
"v3"
1.2 Redis监控
- 悲观锁: 无论什么时候都加锁,认为什么时候都会出现问题
- 乐观锁: 无论什么时候都不加锁,认为什么时候都不会出现问题
只有在跟新数据的时候会判断一下,是否有人修改过数据
Redis检测测试:
- 正常运行
bash
127.0.0.1:6379> set money 100
OK
127.0.0.1:6379> set out 0
OK
127.0.0.1:6379> multi
OK
127.0.0.1:6379> decrby money 20
QUEUED
127.0.0.1:6379> incrby out 20
QUEUED
127.0.0.1:6379> exec
1) (integer) 80
2) (integer) 20
- 测试多线程修改,监视失败(相当于乐观锁
watch
)
监视线程:
bash
127.0.0.1:6379> watch money
OK
127.0.0.1:6379> multi
OK
127.0.0.1:6379> INCR money
QUEUED
127.0.0.1:6379> decr out
QUEUED
127.0.0.1:6379> exec # 另外一个修改了,导致了事务执行失败
(error) EXECABORT Transaction discarded because of previous errors.
另外一个执行的线程:
bash
127.0.0.1:6379> set money 1000000 # 在另外一个事务提交前就修改数据了
OK
1.3 Jedis连接
Jedis是 Redis 官方推荐的 java连接开发工具!使用|ava 操作Redis 中间件!如果你要使用java操作redis,那么一定要对jedis十分熟悉
- 首先创建一个新的空项目
- 导入坐标
java
<dependency>
<groupId>com.alibaba</groupId>
<artifactId>fastjson</artifactId>
<version>1.2.83</version>
</dependency>
<!-- https://mvnrepository.com/artifact/redis.clients/jedis -->
<dependency>
<groupId>redis.clients</groupId>
<artifactId>jedis</artifactId>
<version>5.2.0-beta1</version>
</dependency>
- 连接Redis
java
public class tests {
public static void main(String[] args) {
Jedis jedis = new Jedis("127.0.0.1", 6379);
System.out.println(jedis.ping());
}
}
- 测试连接
jedis.ping()
1.4 SpringBoot整合
- SpringBoot操作数据:spring-data ipa jdbc mongodb redis !
- SpringData 也是和 SpringBoot 齐名的项目!
说明:在 SpringBoot2.x之后,原来使用的jedis 被替换为了 lettuce?
- jedis:采用的直连,多个线程操作的话,是不安全的,如果想要避免不安全的,使用jedis pool连接池! 更像 BIO
- lettuce:采用netty实例可以再多个线程中进行共享,不存在线程不安全的情况!可以减少线程数据了,更像 NIO 模式
源码解释:
- 首先引入坐标:
java
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-data-redis</artifactId>
</dependency>
- 配置类
java
spring.data.redis.port = 6379
spring.data.redis.host= 127.0.0.1
- 执行方法:
java
@Test
void contextLoads() {
redisTemplate.opsForValue().set("zhangsan",123)
System.out.println(redisTemplate.opsForValue().get("zhangsan"));
}
1.5 自定义RedisTemple
为序列化会报错:
java
@Autowired
private RedisTemplate redisTemplate;
@Test
void contextLoads() {
User user = new User("zhangsan",123);
redisTemplate.opsForValue().set("zhangsan",user);
System.out.println(redisTemplate.opsForValue().get("zhangsan"));
}
设置其序列化:
- 配置属于自己的Config
java
@Configuration
public class redisConfig {
@Bean
@SuppressWarnings(value = { "unchecked", "rawtypes" })
public RedisTemplate<Object, Object> redisTemplate(RedisConnectionFactory connectionFactory)
{
RedisTemplate<Object, Object> template = new RedisTemplate<>();
template.setConnectionFactory(connectionFactory);
//JSON序列化配置
Jackson2JsonRedisSerializer jackson2JsonRedisSerializer = new Jackson2JsonRedisSerializer<>(ObjectMapper.class);
ObjectMapper om = new ObjectMapper();
om.setVisibility(PropertyAccessor.ALL, JsonAutoDetect.Visibility.ANY);
om.enableDefaultTyping(ObjectMapper.DefaultTyping.NON_FINAL);
jackson2JsonRedisSerializer.setObjectMapper(om);
StringRedisSerializer stringRedisSerializer = new StringRedisSerializer();
// 使用StringRedisSerializer来序列化和反序列化redis的key值
template.setKeySerializer(stringRedisSerializer);
template.setValueSerializer(jackson2JsonRedisSerializer);
// Hash的key也采用StringRedisSerializer的序列化方式
template.setHashKeySerializer(stringRedisSerializer);
template.setHashValueSerializer(jackson2JsonRedisSerializer);
template.afterPropertiesSet();
return template;
}
}
- 还可以配置自己的Redisutil就可以简单的将数据获取或设置
1.6 Redis.conf详解
- 单位设置:
- 配置文件 unit单位对大小都是一样的,不敏感
-
文件组合:
可以结合多个conf文件
-
网络配置(NETWORK):
bash
bind 127.0.0.1 #绑定的Ip
protect-mode yes #保护模式
port 6357 #端口设置
保护模式
当启用保护模式时,Redis将只允许执行少数安全命令,如SHUTDOWN、PING和INFO,而
禁止执行
可能会对数据
造成不可逆影响
的危险命令
,如FLUSHDB、FLUSHALL和CONFIG等。这有助于防止意外数据丢失或损坏,以及对Redis实例的未经授权的访问。
- 通用配置( GENERAL):
bash
daemonize yes # 以守护进程的方式运行,默认为no,我们需要自己开启yes!
pidfile /var/run/redis_6379.pid # 如果以后台的方式运行,我们就需要指定一个pid文件
#日志
# Specify the server verbosity level.
# This can be one of:
# debug (a lot of information, useful for development/testing)
# verbose (many rarely useful info, but not a mess like the debug level)
# notice (moderately verbose, what you want in production probably)
# warning (only very important / critical messages are logged)
loglevel notice
logfile "" # 日志的文件名
databases 16 # 16个数据库
always-show-logo yes # 是否总是显示LOGO(就是开启服务时的RedisLOGO)
- 快照(SNAPSHOTTING)
- 持久化,在规定时间内,执行了多少次操作,就会持久化文件 ----> rdb,aof
- Redis是内存数据库,如果没有持久化就会导致,断电及失
bash
# 如果在900s内,至少有1个key进行了修改,我们就进行持久化的操作
save 900 1
# 如果在300s内,至少有10个key进行了修改,我们就进行持久化的操作
save 300 10
# 如果在60s内,至少有1000个key进行了修改,我们就进行持久化的操作
save 60 10000
stop-writes-on-bgsave-error yes # 持久化如果出错,是否继续工作
rdbcompression yes # 是否压缩 rdb文件,需要消耗一些cpu资源
rdbchecksum yes # 保存rdb文件的时候,进行错误的检验
dir ./ # 文件保存的目录
- 安全
- 限制(CLENTS)
二、 Redis持久化
Redis是内存数据库,如果没有持久化就会导致,断电及失!
2.1 RDB
RDB: 它是一种开源的内存数据库,用于存储键值对数据,并提供多种数据结构的支持
在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是行话讲的snapshot快照,它恢复时是将快照文件直接读到内存里。
Redis会单独创建(fork)一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不进行任何! 0操作的。这就确保了极高的性能。如果需要进行大规模数据的恢复,目对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。RDB的缺点是最后一次持久化后的数据可能丢失。我们默认的就是RDB,一般情况下不需要修改这个配置!
默认生成的文件名: dump.rdb
-
可以在这里来设置我们的触发条件
-
触发RDB机制
- 满足配置文件,save规则就会触发
- 执行FLUSHALL,也会触发RDB
- 退出Redis也可以触发,产生rdb文件
- 如何恢复RDB文件
- 我们只需要将rdb文件放在Redis的启动文件当中就可以,因为在启动Redis的时候就会自动的去识别dump.rdb
- 查看需要存在的位置
bash
127.0.0.1:6379> config get dir
1) "dir"
2) "/usr/local/bin" # 放在这个位置就可以识别到rdb文件
优点:
- 适合大规模的数据恢复
- 对数据的完整性不高
缺点:
- 需要一定的时间间隔进行操作!如果Redis意外宕机了,最后一次修改数据就没有了
- fork进程的时候,由于是开启了另外一个线程,所以会占用一定的内容空间
所以一般我们在开发的时候都会备份 dump.rdb文件
2.2 AOF进程
以日志的形式来记录每个写操作,将Redis执行过的所有指令记录下来(读操作不记录),只许追加文件但不可以改写文件,redis启动之初会读取该文件重新构建数据,换言之,redis重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作
AOF默认保存的是 appendonly.aof
默认为no,不开启的,需要手动开启
重启redis就会出现aof
- Redis当中的aof文件被破坏了,Redis是启动不了的
可以使用redis-check-aof --fix appendonly.aof
自动进行修复 - 重写规则:
优点:
- 每一次修改都同步,优化了文件的完整性
- 每秒同步一次,可能会丢失那一秒的数据
- 从不同步开启,这样的效率是最高的!
缺点:
- 对于数据文件来说,aof远远大于rdb,修复的速度比rdb慢
- aof的执行操作比rbd的慢
三、Redis发布订阅
发布订阅: 是Redis提供的一种消息传递模式,用于实现消息的发布和订阅机制。在这种模式下,消息的发送者(pub发布者)将消息发送到指定的频道,而消息的接收者(sub订阅者)则订阅对应的频道,从而接收发布到该频道的消息。
- 下图展示了频道 channel1 , 以及订阅这个频道的三个客户端 ------ client2 、 client5 和 client1 之间的关系:
- 当有新消息通过 PUBLISH 命令发送给频道 channel1 时,这个消息就会被发送给订阅它的三个客户端
主要命令:
- 测试:
订阅端:
bash
127.0.0.1:6379> subscribe zhangsan # 订阅名称
Reading messages... (press Ctrl-C to quit)
1) "subscribe"
2) "zhangsan"
3) (integer) 1
1) "message"
2) "zhangsan" # 订阅发布者的名称
3) "helloword" # 发布者发布的内容
1) "message"
2) "zhangsan"
3) "hellow!Redis"
发布端:
bash
127.0.0.1:6379> publish zhangsan helloword # 创建发布者
(integer) 0
127.0.0.1:6379> publish zhangsan helloword # 发布消息
(integer) 1
127.0.0.1:6379> publish zhangsan hellow!Redis
(integer) 1
3.1 Redis主从复制
概念:
- 主从复制,是指将一台Redis服务器的数据,复制到其他的Redis服务器。前者称为主节点(master/leader),后者称为从节点(slave/follower);数据的复制是单向的,只能由主节点到从节点。Master以写为主,Slave以读为主。
- 默认情况下,每台Redis服务器都是主节点;且一个主节点可以有多个从节点(或没有从节点),但一个从节点只能有一个主节点。
主从复制的作用主要包括:
- 数据冗余:主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。
- 故障恢复:当主节点出现问题时,可以由从节点提供服务,实现快速的故障恢复;实际上是一种服务的冗余。
- 负载均衡:在主从复制的基础上,配合读写分离,可以由主节点提供写服务,由从节点提供读服务(即写Redis数据时应用连接主节点,读Redis数据时应用连接从节点),分担服务器负载;尤其是在写少读多的场景下,通过多个从节点分担读负载,可以大大提高Redis服务器的并发量。
- 高可用(集群)基石:除了上述作用以外,主从复制还是哨兵和集群能够实施的基础,因此说主从复制是Redis高可用的基础,。
一般来说,要将Redis运用于工程项目中,只使用一台Redis是万万不能的(宕机),原因如下:
- 从
结构
上,单个Redis服务器会发生单点故障,并且一台服务器需要处理所有的请求负载,压力较大;- 从
容量
上,单个Redis服务器内存容量有限,就算一台Redis服务器内存容量为256G,也不能将所有内存用作Redis存储内存一般来说,单台Redis最大使用内存不应该超过20G。
电商网站上的商品,一般都是一次上传,无数次浏览的,说专业点也就是多读少写。
主从复制,读写分离! 80%的情况下都是在进行读操作!减缓服务器的压力!架构中经常使用! 一主二从(最低标准)
3.2 集群环境配置
查看环境信息info replication
bash
127.0.0.1:6379> info replication # 查看当前库的信息
# Replication
role:master # 角色 master
connected_slaves:0 # 没有从机
master_replid:20cbd141dbd0a1a45f20841f5dc80f06ddc08730
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:0
second_repl_offset:-1
repl_backlog_active:0
repl_backlog_size:1048576
repl_backlog_first_byte_offset:0
repl_backlog_histlen:0
复制3个配置文件,然后修改对应的信息
- 端口
- pid 名字
- log文件名字
- dump.rdb 名字
3.3、复制原理
默认情况下,每台Redis服务器都是主节点
; 一般情况下只需要配置从机
bash
slaveof host port # host和port都是主机的地址以及主机开启redis的port
真实的从主配置应该在配置文件中配置,这样的话是永久的,我们这里使用的是命令,暂时!
bash
replicaof <masterip> <masterport> # 配置主机的主机地址,端口号
masterauth <master-password> # 有密码还需要把密码配上
细节
- 主机可以写,从机不能写只能读!主机中的所有信息和数据,都会自动被从机保存!
- 测试:
主机断开连接
,从机
依旧连接到主机的,但是没有写
操作,这个时候,主机如果回来了,从机依旧可以
直接获取
到主机写的信息
!- 如果是使用命令行,来配置的主从,这个时候如果重启了,就会变回主机!只要变为从机,立马就会从主机中获取值!
复制原理
Slave 启动成功连接到 master 后会发送一个sync同步命令
Master 接到命令,启动后台的存盘进程,同时收集所有接收到的用于修改数据集命令,在后台进程执行完毕之后,master将传送整个数据文件到slave,并完成一次完全同步。
- 全量复制:而slave服务在接收到数据库文件数据后,将其存盘并加载到内存中
- 增量复制:Master 继续将新的所有收集到的修改命令依次传给slave,完成同步
但是只要是重新连接master,一次完全同步(全量复制)将被自动执行!我们的数据一定可以在从机上看到!
3.4、宕机后主动变为主机
层层链路
上一个M连接下一个S
这时候也可以完成我们的主从复制!
如果没有主机了,这时候需要选出一个主机
如果主机断开了连接,我们可以使用SLAVEOF no one让自己变成主机!其他节点可以手动连接到最新的这个节点。如果主机修复了,需要重新配置
3.5、哨兵模式
(自动选取主机模式)
主从切换技术的方法是:当主服务器宕机后,需要手动把一台从服务器切换为主服务器,这就需要人工干预,费事费力,还会造成一段时间内服务不可用。这不是一种推荐的方式,更多时候,我们优先考虑哨兵模式。Redis从2.8开始正式提供了Sentinel(哨兵)架构来解决这个问题。
谋朝篡位的自动版,能够后台监控主机是否故障,如果故障了根据投票数自动将从库转换为主库。
哨兵模式是一种特殊的模式,首先Redis提供了哨兵的命令,哨兵是一个独立的进程,作为进程,它会独立运行。其原理是哨兵通过发送命令,等待Redis服务器响应,从而监控运行的多个Redis实例。
这里的哨兵有两个作用
- 通过发送命令,让Redis服务器返回监控其运行状态,包括主服务器和从服务器。
- 当哨兵监测到master宕机,会自动将slave切换成master,然后通过发布订阅模式通知其他的从服务器,修改配置文件,让它们切换主机。
然而一个哨兵进程对Redis服务器进行监控,可能会出现问题,为此,我们可以使用多个哨兵进行监控。各个哨兵之间还会进行监控,这样就形成了多哨兵模式。
实现原理:
- 假设主服务器宕机,哨兵1先检测到这个结,系统并不会马上进行failover过程,仅仅是哨兵1主观的认为主服务器不可用,这个现象成为
主观下线
。 - 当后面的哨兵也检测到主服务器不可用,并且数量达到一定值时,那么哨兵之间就会进行一次投票,投票的结果由一个哨兵发起,进行failover[故障转移]操作。
- 切换成功后,就会通过发布订阅模式,让各个哨兵把自己监控的从服务器实现切换主机,这个过程称为
客观下线
。
测试
- 配置哨兵配置文件 sentinel.conf
bash
sentinel monitor 被监控的名称 hsot prot 1
sentinel monitor myredis 127.0.0.1 6379 1
后面的这个数字1,代表主机挂了,slave投票看让谁接替成为主机,票数最多的,就会成为主机!
如果Master 节点断开了,这个时候就会从从机中随机选择一个服务器!(这里面有一个投票算法!)
哨兵模式
如果主机此时回来了,只能归并到新的主机下,当做从机,这就是哨兵模式的规则!
- 优点:
- 哨兵集群,基于主从复制模式,所有的主从配置优点,它全有
- 主从可以切换,故障可以转移,系统的可用性就会更好
- 哨兵模式就是主从模式的升级,手动到自动,更加健壮!
- 缺点:
- Redis 不好在线扩容的,集群容量一旦到达上限,在线扩容就十分麻烦!
- 实现哨兵模式的配置其实是很麻烦的,里面有很多选择!
四、Redis缓存穿透和雪崩
Redis缓存的使用,极大的提升了应用程序的性能和效率,特别是数据查询方面。但同时,它也带来了一些问题。其中,最要害的问题,就是数据的一致性问题,从严格意义上讲,这个问题无解。如果对数据的一致性要求很高,那么就不能使用缓存。
另外的一些典型问题就是,缓存穿透、缓存雪崩和缓存击穿。目前,业界也都有比较流行的解决方案。
4.1、缓存穿透(查不到)
概念
缓存穿透的概念很简单,用户想要查询一个数据,发现redis内存数据库没有,也就是缓存没有命中,于是向持久层数据库查询。发现也没有,于是本次査询失败。当用户很多的时候,缓存都没有命中(秒杀!),于是都去请求了持久层数据库。这会给持久层数据库造成很大的压力,这时候就相当于出现了缓存穿透。
解决方案
- 布隆过滤器
布隆过滤器是一种数据结构,对所有可能査询的参数以hash形式存储,在控制层先进行校验,不符合则丢弃,从而避免了对底层存储系统的查询压力;
- 缓存空对象
当存储层不命中后,即使返回的空对象也将其缓存起来,同时会设置一个过期时间,之后再访问这个数据将会从缓存中获取,保护了后端数据源
但是这种方法会存在两个问题:
- 如果空值能够被缓存起来,这就意味着缓存需要更多的空间存储更多的键,因为这当中可能会有很多的空值的键;
- 即使对空值设置了过期时间,还是会存在缓存层和存储层的数据会有一段时间窗口的不一致,这对于需要保持一致性的业务会有影响。
4.2、缓存击穿(量太大,缓存过期!)
- 概述
这里需要注意和缓存击穿的区别,缓存击穿,是指一个key非常热点,在不停的扛着大并发,大并发集中对这一个点进行访问,当这个key在失效的瞬间,持续的大并发就穿破缓存,直接请求数据库,就像在一个屏障上凿开了一个洞。
当某个key在过期的瞬间,有大量的请求并发访问,这类数据一般是热点数据,由于缓存过期,会同时访问数据库来查询最新数据,并且回写缓存,会导使数据库瞬间压力过大。
解决方案:
- 设置热点数据永不过期
从缓存层面来看,没有设置过期时间,所以不会出现热点 key 过期后产生的问题。
- 加互斥锁
分布式锁 :使用分布式锁,保证对于每个key同时只有一个线程去査询后端服务,其他线程没有获得分布式锁的权限,因此只需要等待即可。这种方式将高并发的压力转移到了分布式锁,因此对分布式锁的考验很大。
4.3、缓存雪崩
缓存雪崩,是指在某一个时间段,缓存集中过期失效。Redis 宕机!
产生雪崩的原因之一,比如在写本文的时候,马上就要到双十二零点,很快就会迎来一波抢购,这波商品时间比较集中的放入了缓存,假设缓存一个小时。那么到了凌晨一点钟的时候,这批商品的缓存就都过期了。而对这批商品的访问査询,都落到了数据库上,对于数据库而言,就会产生周期性的压力波峰。于是所有的请求都会达到存储层,存储层的调用量会暴增,造成存储层也会挂掉的情况。
其实集中过期,倒不是非常致命,比较致命的缓存雪崩,是缓存服务器某个节点宕机或断网。因为自然形成的缓存雪崩,一定是在某个时间段集中创建缓存,这个时候,数据库也是可以顶住压力的。无非就是对数据库产生周期性的压力而已。而缓存服务节点的宕机,对数据库服务器造成的压力是不可预知的,很有可能瞬间就把数据库压垮。
解决方案
- redis高可用
这个思想的含义是,既然redis有可能挂掉,那我多增设几台redis,这样一台挂掉之后其他的还可以继续工作,其实就是搭建的集群。
- 限流降级
这个解决方案的思想是,在缓存失效后,通过加锁或者队列来控制读数据库写缓存的线程数量。比如对某个kev只允许一个线程查询数据和写缓存,其他线程等待。
- 数据预热
数据加热的含义就是在正式部署之前,我先把可能的数据先预先访问一遍,这样部分可能大量访问的数据就会加载到缓存中。在即将发生大并发访问前手动触发加载缓存不同的key,设置不同的过期时间,让缓存失效的时间点尽量均匀。