Redis的性能，哨兵模式，集群，

Redis的性能管理;

redis的数据保存在内存中

redis-cli info memory

redis内存使用info memory命令参数解析

used_memory:236026888 由 Redis 分配器分配的内存总量，包含了redis进程内部的开销和数据占用的内存，以字节（byte）为单位

used_memory_rss:274280448 redis向操作系统申请的内存大小

used_memory_peak:458320936 redis的内存消耗峰值(以字节为单位)

内存碎片率：

used_memory_rss/used_memory系统已经分配给了redis，但是redis未能够有效利用的内存

如何查看内存碎片率：

redis-cli info memory | grep ratio

allocator frag ratio:1.19

分配碎片的比例，redis 主进程调度时产生的内存，比例越小，值越高，内存的浪费越多
allocator rss ratio:7.15

分配器占用物理内存的比例，告诉你主进程调度执行时占用了多少物理内存
rss overhead ratio:0.31

rss是向系统申请的内存空间，Redis占用物理空间额外的开销比例，比例越低好，redis实际占用的物理内存和向系统申请的内存月接近，额外的开销越低
mem_fragmentation ratio:3.33

内存碎片的比例，越低越好，内存的使用率越高

如何自动清理碎片：

vim /etc/redis/6379.conf

.....

activedefrag yes

#最后一行添加

如何手动清理碎片：

redis-cli memory purge

设置redis的内存最大阈值:

一但到达阈值，会自动清理碎片，开启key的回收机制

vim /etc/redis/6379.conf

........

#568行添加

maxmemory 1gb

key的回收策略

vim /etc/redis/6379.conf

.......

#598行添加如下（一般保留最后一个策略,根据需求添加）：

maxmemory-policy volatile-lru：使用redis内资的lru算法，把已经设置了过期时间的键值对对中淘汰数据，移除最少使用的键值对。对已经设置了过期时间的键值对
maxmemory-policy volatile-ttl：已经设置了时间的键值对，从当中挑选一个即将过期的键值对，针对有设置过期时间的键值对
maxmemory-policy-volatile-random:从已经设置了过期时间的键值对当中，挑选数据随机淘汰键值对。对设置时间的键值对进行随机移除
mllkey-lru:lru算法当中，对所有的键值对进行淘汰，移除最少使用的键值对，针对所有的键值对
allkeys-random:从所有键值对中任意选择键值对进行淘汰
maxmemory-policy noeciction:禁止键值对回收，（不删除任何键值对，直到Redis内存塞满了）

在工作中一定要给redis占用内存设置阈值

面试：

redis占用内存的效率问题如何解决

1 日常巡检中。对redis 占用内存情况做监控

2 设置redis占用系统内存的阈值，避免占用系统全部内存

3 内存碎片清理，手动.自动清理

4 配置合适的Key的回收机制

Redis的报错问题：

1 雪崩：

缓存雪崩，大量的应用请求无法在redis缓冲中处理，会把所有的请求发送到后台数据库，数据库的压力会大，数据库本身并发能力差，一旦高并发，数据库会崩溃

redis集群大面积故障，Redis缓存中，大量数据同时过期，大量的请求无法得到处理。Redis实例宕机

1.1解决方案：

事前：高可用架构，防止整个缓存故障，，主从复制，和哨兵模式，Redis集群。

事中：在国内用的比较多的方式,hystrix,熔断，限流三个手段来降低雪崩发生之后的损失，数据库不死即可，慢可以，但是不能没有响应

事后，Redis备份。快速缓存预热

2 redis的缓存击穿（重要）

主要是热点数据缓存过期，或者删除，多个请求并发访问热点数据，请求转发到数据库，导致数据库的性能下降，经常请求的缓存数据，最好设置为永不过期

3 Redis的缓存穿透

缓存中没有数据，数据库也没有对应的数据，但是有用户一直发起这个请求，而且请求的数据是很大，一般是被黑客利用

Redis的主从复制

主从复制的作用：

是redis实现高可用的基础，哨兵模式和集群都是在主从复制的基础之上实现高可用，主从复制实现数据的多机备份，以及读写分离（主服务器负责写，从服务器只读）

缺陷：故障无法自动恢复，需要人工干预，写操作的负载均衡

主从复制的工作原理：

主节点从节点组成，数据复制是单向，只能从主节点到从节点

1 主节点：主节点收到请求之后，他不管slave是第一次连接还是重新连接，主节点都会启动一个后台进程，执行bgsave主节点会把所有修改数据记录的命令加载到缓存和数据文件之中，

主从复制推荐使用AOF

建立连接：slave向主发送一个syn command,请求和主节点建立连接

数据文件创建完毕之后，master把数据文件传送到salve，slave 会把这个数据文件，先保存到硬盘，然后在加载到内存

实验架构：

192.168.233.7 主

192.168.233.8 从

192.168.233.9 从

依赖环境 Redis 先准备好

主：

从1 和从2

查看日志是否建好

验证是否主从

同时登录redis ,主写入从节点无法写

哨兵模式

先有主从,再有哨兵，再主从复制的基础之上，实现主节点故障的自动切换，

哨兵模式的原理：

哨兵是一个分布式系统，用于在主从结构之间，对每台redis的服务器进行监控，主节点出现故障时，从节点通过投票的方式选择一个新的master 哨兵模式也需要至少三个节点，

哨兵模式的结构：

哨兵节点：监控节点，不存储数据

数据节点：主从节点，都是数据节点

主节点的选举过程：

1 已经下线的从节点，不会被选为主节点

2 选择配置文件当中，从节点优先级最高的replica-priority 100

3 选择一个复制数据最完整的从节点

哨兵节点通过raft算法（选举算法），每个节点共同投票选举出一个新的master，然后新的master实现主节点转移和故障恢复通知

每个哨兵节点每隔一秒，通过ping命令方式，检测主从之间的心跳线，主节点在一定时间内没有回复或者恢复了错误的信息，这个时候哨兵就会主观的判断主节点下线了，超过半数的节点哨兵认为主节点下线了，这个时候才会认为主节点是客观下线

主：

sentinel monitor mymaster 192.168.233.7 6379 2

#指向表示至少需要2台服务器认为主已经下线，才会进行主从切换。

从1和从2：

启动配置文件先启动再启动从，挨个执行一遍

查看状态信息

日志查看从节点的信息

Redis 集群：

Redis3.0引入的分布式存储方案

工作模式：

集群有多个node节点组成，Redis数据分布在这些节点上，在集群之中，分为主节点和从节点

集群模式中主从一一对应，数据写的读取和主从模式一样，主负责写，从模式只能写，集群模式自带哨兵模式，可以自动实现故障切换，但是故障切换中，整个集群不能使用，切换完毕之后集群会立刻恢复

集群模式是按照数据分片划分：

1 数据分片：是集群的核心功能，每个主都要提供读写的功能，但是数据一一对应写入对应的从节点，在集群模式中，可以容忍数据的不完整

2 高可用：集群的主要目的

数据分片的实现过程：

redis集群引入了哈希槽的概念

redis集群当中16384个哈希槽位（0-16384）

根据集群当中主节点从节点，分配哈希槽位，每个主从节点只负责一部分的

哈希槽位是连续的哈希槽位，如果出现不连续的哈希值，或者哈希槽位没有被分配，集群将会报错

主宕机之后，主节点原来负责的哈爷槽位将会不可用，需要从节点代替主节点继续负责原有的哈希操作。保证集群正常工作，故障切换的过程中，会提示集群不可用。切换完成，集群恢复继续工作。

每次读写都涉及到哈希槽位，Keyt通过crc16验证之后，对16384取余数，余数值决定数据放入哪个哈希槽位，通过这个值去找到对应的槽位所在的节点，然后直接跳转到这个节点

集群的流程：

1 集群自带主从和哨兵模式，

2 每个主从是互相隔的可以容忍数据的不完整，目的：高可用

3 哈希槽位为决定每个节点的读写槽位，在创建Key时，系统已经分配好了指定槽位

4 如果是出现MOVED不是报错，是提醒客户端取分配好的槽位节点，获取数据

实验

实验需求：需要6台装有redis的虚拟机

六台redis服务器都配置

vim /etc/redis/6379.conf

*****************************************************************************************

1、默认监听所有网卡-----70行

bind 0.0.0.0

2、关闭保护模式-----89行

protect-mode no

3、开启守护进程，以独立进程启动-----137行

daemonize yes

4、开启AOF持久化-----700行

appendonly yes

5、开启集群功能-----833行

cluster-enabled yes

6、集群名称文件设置-----841行

cluster-config-file nodes-6003.conf

7、集群超时时间设置-----847行（15000毫秒）

cluster-node-timeout 15000

*****************************************************************************************

创建集群：redis-cli -h 所在服务器ip --cluster create ip地址:6379 --cluster-replicas 1

此时在192.168.10.80主机创建

redis-cli -h 192.168.10.80 --cluster create 192.168.10.80:6379 192.168.10.150:6379 179 192.168.10.152:6379 192.168.10.153:6379 192.168.10.154:6379 --cluster-replicas 1

root@localhost \~\]# redis-cli -h 192.168.10.80 --cluster create 192.168.10.80:6379 192.168.79 192.168.10.152:6379 192.168.10.153:6379 192.168.10.154:6379 --cluster-replicas 1 \>\>\> Performing hash slots allocation on 6 nodes... Master\[0\] -\> Slots 0 - 5460 Master\[1\] -\> Slots 5461 - 10922 Master\[2\] -\> Slots 10923 - 16383 Adding replica 192.168.10.153:6379 to 192.168.10.80:6379 Adding replica 192.168.10.154:6379 to 192.168.10.150:6379 Adding replica 192.168.10.152:6379 to 192.168.10.151:6379 M: f9a09e3ededa9767aafc6aca98fcaad8e28272b6 192.168.10.80:6379 slots:\[0-5460\] (5461 slots) master M: 508caf1dfeab313b2df0173dc015b62591b012fb 192.168.10.150:6379 slots:\[5461-10922\] (5462 slots) master M: 68d8e79f5b4478dcd8143ef024607f17d02820c6 192.168.10.151:6379 slots:\[10923-16383\] (5461 slots) master S: 6c1dc5ae608ca1c20f80f4762933ee07aa4a77c5 192.168.10.152:6379 replicates 68d8e79f5b4478dcd8143ef024607f17d02820c6 S: d82924c43dd5c907fda4abf35ffe33ad2b295abf 192.168.10.153:6379 replicates f9a09e3ededa9767aafc6aca98fcaad8e28272b6 S: 8ae774dce41372b08e38904ef81adba51413d072 192.168.10.154:6379 replicates 508caf1dfeab313b2df0173dc015b62591b012fb Can I set the above configuration? (type 'yes' to accept): yes \>\>\> Nodes configuration updated \>\>\> Assign a different config epoch to each node \>\>\> Sending CLUSTER MEET messages to join the cluster Waiting for the cluster to join .... \>\>\> Performing Cluster Check (using node 192.168.10.80:6379) M: f9a09e3ededa9767aafc6aca98fcaad8e28272b6 192.168.10.80:6379 slots:\[0-5460\] (5461 slots) master 1 additional replica(s) S: 8ae774dce41372b08e38904ef81adba51413d072 192.168.10.154:6379 slots: (0 slots) slave replicates 508caf1dfeab313b2df0173dc015b62591b012fb S: 6c1dc5ae608ca1c20f80f4762933ee07aa4a77c5 192.168.10.152:6379 slots: (0 slots) slave replicates 68d8e79f5b4478dcd8143ef024607f17d02820c6 M: 68d8e79f5b4478dcd8143ef024607f17d02820c6 192.168.10.151:6379 slots:\[10923-16383\] (5461 slots) master 1 additional replica(s) S: d82924c43dd5c907fda4abf35ffe33ad2b295abf 192.168.10.153:6379 slots: (0 slots) slave replicates f9a09e3ededa9767aafc6aca98fcaad8e28272b6 M: 508caf1dfeab313b2df0173dc015b62591b012fb 192.168.10.150:6379 slots:\[5461-10922\] (5462 slots) master 1 additional replica(s) \[OK\] All nodes agree about slots configuration. \>\>\> Check for open slots... \>\>\> Check slots coverage... \[OK\] All 16384 slots covered. \[root@localhost \~\]# ![](https://file.jishuzhan.net/article/1730136545765101569/1becf0aca2df3c60a18744727cdd2b04.webp) #### **查看hash槽位CLUSTER nodes** ![](https://file.jishuzhan.net/article/1730136545765101569/2f77d577280d7ce370817fbfdb9f614a.webp) ![](https://file.jishuzhan.net/article/1730136545765101569/dfae66aa363c40a593c9a876df5f0552.webp) ![](https://file.jishuzhan.net/article/1730136545765101569/3b13ab738fd6e346d4fe0db18a70bda1.webp) ##### 验证从节点不能读 ![](https://file.jishuzhan.net/article/1730136545765101569/f8bfbd3aef8a73dd894bb4b031a679e1.webp) **此处error不是报错，表明客户端尝试读取键值对test1，但是实际槽位在4768，因此集群要求客户端移动到4768槽位所在的主机节点获取数据** （2）验证从节点能不能写。不能 ![](https://file.jishuzhan.net/article/1730136545765101569/92db82996a84f4739a12254ab5bee9c7.webp) ##### （3）验证分配hash槽位后，不在相应的hash槽位上的主节点能不能写。不能，只能到指定节点上操作 **主** ![](https://file.jishuzhan.net/article/1730136545765101569/e5eaa5dc290ce825272310aa31bf2f00.webp) **从** ![](https://file.jishuzhan.net/article/1730136545765101569/1b85770c1fd5c902bb1c20ac2ae8bb13.webp) #### 模拟故障 任意一台主服务器故障 主20.0.0.34------redis3故障，从20.0.0.44------redis4成为新主 ![](https://file.jishuzhan.net/article/1730136545765101569/5d34780d8a97071e47c18e89412a6d44.webp) ![](https://file.jishuzhan.net/article/1730136545765101569/d3e228d827457aea2ed020e1bebc48c1.webp) #### **monitor 查看哨兵的ping命令** **监控redis实时工作日志，检测主从节点之间的心跳线** 主 ![](https://file.jishuzhan.net/article/1730136545765101569/046f9bbdf9b354cda4ba4d56a7a48550.webp) 从 ![](https://file.jishuzhan.net/article/1730136545765101569/fea96f08cf2ea62ec939319407efa45a.webp)