Redis哨兵(sentinel)

文章目录


是什么

吹哨人巡察监控后台master主机是否故障,如果故障了根据投票数自动将某一个从库转换为新主库,继续对外服务

作用

哨兵的作用:

1、监控redis运行状态,包括master和slave

2、当master down机,能自动将slave切换成新master

  • 主从监控
    监控主从redis库运行是否正常
  • 消息通知
    哨兵可以将故障转移的结果发送给客户端
  • 故障转移
    如果master异常,则会进行主从切换,将其中一个slave做为新master
  • 配置中心
    客户端通过连接哨兵来获得当前redis服务的主节点地址

实际操作案例

架构说明

步骤

从myredis目录下新建或者拷贝sentinel.conf文件

查看/opt目录下默认的sentinel.conf文件内容

重点参数说明

bind

服务监听地址,用于客户端连接,默认本机地址

daemonize

是否以后台daemon方式运行

protected-mode

安全保护模式

port

端口

logfile

日志文件路径

pidfile

pid文件路径

dir

工作目录

sentinel monitor

设置要监控的master服务器

quorum表示最少有几个哨兵认可客观下线,同意故障迁移的法定票数

行尾最后的quorum代表什么意思呢?quorum:确认客观下线的最少的哨兵数量

我们知道,网络是不可靠的,有时候一个sentinel会因为网络堵塞而误以为一个master redis已经死掉了,在sentinel集群环境下需要多个sentinel互相沟通来确认某个master是否真的死了,quorum这个参数是进行客观下线的一个依据,意思是至少有quorum个sentinel认为这个master有故障,才会对这个master进行下线以及故障转移。因为有的时候,某个sentinel节点可能因为自身网络原因,导致无法连接master,而此时master并没有出现故障,所以,这就需要多个sentinel都一致认为该master有问题,才可以进行下一步操作,这就保证了公平性和高可用。

sentinel auth-pass

master设置了密码,连接master服务的密码

其他

bash 复制代码
sentinel down-after-milliseconds <master-name> <milliseconds>:

指定多少毫秒之后,主节点没有应答哨兵,此时哨兵主观上认为主节点下线

 

sentinel parallel-syncs <master-name> <nums>:

表示允许并行同步的slave个数,当Master挂了后,哨兵会选出新的Master,此时,剩余的slave会向新的master发起同步数据

 

sentinel failover-timeout <master-name> <milliseconds>:

故障转移的超时时间,进行故障转移时,如果超过设置的毫秒,表示故障转移失败

 

sentinel notification-script <master-name> <script-path> :

配置当某一事件发生时所需要执行的脚本

 

sentinel client-reconfig-script <master-name> <script-path>:

客户端重新配置主节点参数脚本

配置

bash 复制代码
哨兵1
bind 0.0.0.0
daemonize yes
protected-mode no
port 26379
logfile "/myredis/sentinel26379.log"
pidfile /var/run/redis-sentinel26379.pid
dir /myredis
sentinel monitor mymaster 192.168.111.169 6379 2
sentinel auth-pass mymaster 111111
bash 复制代码
哨兵2
bind 0.0.0.0
daemonize yes
protected-mode no
port 26380
logfile "/myredis/sentinel26380.log"
pidfile /var/run/redis-sentinel26380.pid
dir "/myredis"
sentinel monitor mymaster 192.168.111.169 6379 2
sentinel auth-pass mymaster 111111
bash 复制代码
哨兵3
bind 0.0.0.0
daemonize yes
protected-mode no
port 26381
logfile "/myredis/sentinel26381.log"
pidfile /var/run/redis-sentinel26381.pid
dir "/myredis"
sentinel monitor mymaster 192.168.111.169 6379 2
sentinel auth-pass mymaster 111111

启动

bash 复制代码
redis-sentinel sentinel26379.conf --sentinel
redis-sentinel sentinel26380.conf --sentinel
redis-sentinel sentinel26381.conf --sentinel



哨兵运行流程和选举原理

当一个主从配置中的master失效之后,sentinel可以选举出一个新的master用户自动接替原master的工作,主从配置中的其他redis服务器自动指向新的master同步数据,一般建议sentinel采用奇数台,防止某一台sentinel无法连接到master导致误切换

主观下线

所谓主观下线(Subjectively Down, 简称 SDOWN)指的是单个Sentinel实例对服务器做出的下线判断,即单个sentinel认为某个服务下线(有可能是接收不到订阅,之间的网络不通等等原因)。主观下线就是说如果服务器在[sentinel down-after-milliseconds]给定的毫秒数之内没有回应PING命令或者返回一个错误消息, 那么这个Sentinel会主观的(单方面的)认为这个master不可以用了

sentinel down-after-milliseconds

表示master被当前sentinel实例认定为失效的间隔时间,这个配置其实就是进行主观下线的一个依据

master在多长时间内一直没有给Sentine返回有效信息,则认定该master主观下线。也就是说如果多久没联系上redis-servevr,认为这个redis-server进入到失效(SDOWN)状态。

客观下线

四个参数含义:

masterName是对某个master+slave组合的一个区分标识(一套sentinel可以监听多组master+slave这样的组合)

quorum这个参数是进行客观下线的一个依据,法定人数/法定票数

意思是至少有quorum个sentinel认为这个master有故障才会对这个master进行下线以及故障转移。因为有的时候,某个sentinel节点可能因为自身网络原因导致无法连接master,而此时master并没有出现故障,所以这就需要多个sentinel都一致认为该master有问题,才可以进行下一步操作,这就保证了公平性和高可用。

选出领导者的哨兵(哨兵中选一个代表)

如何选出领导者?

通过raft算法

监视该主节点的所有哨兵都有可能被选为领导者,选举使用的算法是Raft算法;Raft算法的基本思路是先到先得:

即在一轮选举中,哨兵A向B发送成为领导者的申请,如果B没有同意过其他哨兵,则会同意A成为领导者

由选出的代表进行故障切换

三步骤

选出一个master

选出的规则

  • redis.conf文件中,优先级slave-priority或者replica-priority最高的从节点(数字越小优先级越高 )
  • 复制偏移位置offset最大的从节点
  • 最小Run ID的从节点
重新认码头(重新编辑主从关系)
  • 执行slaveof no one命令让选出来的从节点成为新的主节点,并通过slaveof命令让其他节点成为其从节点
  • Sentinel leader会对选举出的新master执行slaveof no one操作,将其提升为master节点
  • Sentinel leader向其它slave发送命令,让剩余的slave成为新的master节点的slave
原master节点恢复后自动降级为slave
  • 将之前已下线的老master设置为新选出的新master的从节点,当老master重新上线后,它会成为新master的从节点
  • Sentinel leader会让原来的master降级为slave并恢复正常工作。

哨兵使用建议

  • 哨兵节点的数量应为多个,哨兵本身应该集群,保证高可用
  • 哨兵节点的数量应该是奇数
  • 各个哨兵节点的配置应一致
  • 如果哨兵节点部署在Docker等容器里面,尤其要注意端口的正确映射
  • 哨兵集群+主从复制,并不能保证数据零丢失
相关推荐
呼啦啦啦啦啦啦啦啦5 分钟前
【Redis】事务
数据库·redis·缓存
黑金IT36 分钟前
Laravel 实战:用Carbon筛选最近15分钟内的数据
php·laravel
赵相机-1 小时前
Spring集成Redis|通用Redis工具类
spring boot·redis·spring
书生-w1 小时前
Redis Windows 解压版安装
数据库·windows·redis
猿小飞1 小时前
redis 5.0版本和Redis 7.0.15的区别在哪里
数据库·redis·缓存
zhangxueyi2 小时前
如何理解Linux的根目录?与widows系统盘有何区别?
linux·服务器·php
呼啦啦啦啦啦啦啦啦4 小时前
【Redis】持久化机制
java·redis·mybatis
事业运财运爆棚12 小时前
Laravel 请求接口 调用2次
php·laravel
寰宇软件13 小时前
PHP CRM售后系统小程序
微信小程序·小程序·vue·php·uniapp
方圆想当图灵14 小时前
缓存之美:万文详解 Caffeine 实现原理(下)
java·redis·缓存