Redis 哨兵(Sentinel)原理

在 Redis 高可用架构中,哨兵(Sentinel) 扮演着至关重要的角色。它不仅能自动监控主从节点状态,还能在主节点故障时完成自动切换,保障服务持续可用。本文将系统梳理 Sentinel 的核心机制。

一、哨兵的作用

Redis Sentinel 主要提供以下三大能力:

  • 状态监控:持续检查 master/slave 健康状态
  • 自动故障转移:master 宕机时,自动选举新 master 并重配置集群
  • 服务发现:客户端可通过哨兵查询当前 master 地址

💡 注意:Sentinel 不负责数据存储,仅用于管理与协调。


二、状态监控与故障判定

Sentinel 是怎么知道 Redis 节点宕机的?

Sentinel 通过一套严谨的心跳 + 投票机制判断节点是否真正失效:

  1. 心跳检测

    默认每 1 秒向所有 Redis 节点发送 PING 命令。若在 down-after-milliseconds(默认 30 秒)内未收到有效响应,则该哨兵将节点标记为 主观下线(SDOWN)

  2. 主观下线(SDOWN)

    单个哨兵认为节点不可用,但不足以触发故障转移

  3. 客观下线(ODOWN)

    quorum 个哨兵 都报告 SDOWN 时,Sentinel 集群将该 master 标记为 客观下线(ODOWN),正式进入故障恢复流程。

关键提示
quorum 仅用于判定 ODOWN,Leader 选举仍需获得多数派支持(> N/2) 。例如 3 个哨兵,quorum=2 可触发 ODOWN,但选 Leader 仍需至少 2 票。


三、故障恢复:选举新主

一旦 master 被标记为 ODOWN,Sentinel 就会在 slave 中选举新的主节点。

选主前过滤

并非所有 slave 都有资格参选,首先排除以下两类:

  • replica-priority = 0 的 slave(明确禁止晋升)
  • 与原 master 断连时间过长的 slave(数据太旧,可能丢失大量写入)

选主标准(按优先级排序)

满足基本条件后,按以下顺序择优:

  1. replica-priority 越小越优(默认 100,0 表示不参选)
  2. 复制偏移量(offset)越大越优(代表数据最新)
  3. run_id 字典序越小越优(作为随机兜底,避免平票)

四、哨兵 Leader 选举

故障转移操作只能由一个哨兵执行,因此需要先选出 Leader

成为 Leader 的条件

  • 获得 超过半数 哨兵的投票
  • 得票数 不少于 quorum

投票原则

  • 优先投票给当前得票最多的候选者
  • 若无人领先,则投给自己

⚠️ 常见误解:

"谁先发现 master 下线,谁就当 Leader" ------ 这是错误的!

实际采用类似 Raft 的共识机制,需经过一轮正式投票,不是"先到先得"


五、状态通知与重配置

Leader 选出后,开始执行故障转移的重配置流程:

  1. 新 master 发送命令:

    Redis 4.0 及以下 SLAVEOF no one

    Redis 5.0 及以上 REPLICAOF no one

  2. 其他 slave 发送命令:

    Redis 4.0 及以下 SLAVEOF<new_master_ip> <port>

    Redis 5.0 及以上 REPLICAOF <new_master_ip> <port>

  3. 原 master 重启后

    Sentinel 会主动连接它,并发送 REPLICAOF <new_master>,将其降级为 slave。

    🔒 重要不会修改其 redis.conf 配置文件,角色切换完全通过运行时指令完成。

  4. 通知客户端

    • 通过 Pub/Sub 发布 +switch-master 事件

    • 客户端可调用 API 查询:

      bash 复制代码
      SENTINEL get-master-addr-by-name mymaster

六、最佳实践建议

为确保 Sentinel 稳定可靠,推荐遵循以下原则:

  • 部署 ≥ 3 个哨兵(奇数),避免脑裂
  • 合理设置 down-after-milliseconds(如 10s~30s)和 quorum
  • 客户端必须通过 Sentinel 获取 master 地址,禁止直连 Redis 节点
  • 监控哨兵日志,关注 +switch-master+sdown 等关键事件

总结

Redis Sentinel 通过"监控 → 判定 → 选举 → 通知"四步闭环,实现了 Redis 主从架构的自动高可用。理解其原理,是构建稳定缓存系统的基石。


作者:不会写程序的未来程序员

首发于 CSDN 欢迎点赞、收藏、评论交流!

版权声明:本文为原创文章,转载请注明出处。

相关推荐
流星白龙10 小时前
【MySQL高阶】26.事务(1)
数据库·mysql
三十..11 小时前
Redis 核心原理与高可用架构实践
运维·数据库·redis
这个DBA有点耶11 小时前
索引优化深潜(下):索引合并、ICP 与索引设计的实战法则
数据库·mysql·架构
努力努力再努力wz11 小时前
【内存管理与高并发内存池系列】从 mmap 到 malloc:文件映射、匿名映射与 glibc 内存分配机制详解
linux·c语言·数据结构·数据库·c++·qt·链表
JdSnE27zv12 小时前
Qt 操作SQLite数据库
数据库·qt·sqlite
tedcloud12312 小时前
HyperFrames部署教程:用HTML生成MP4视频
前端·数据库·人工智能·html·音视频
布朗克16812 小时前
25 IO流高级操作——序列化、NIO与Files工具类
java·数据库·io·nio
阿演12 小时前
DataDjinn 新版本更新:新增 Oracle 支持,查询窗口、表预览和连接树继续打磨
数据库·oracle·ai编程·数据库连接工具
lixora12 小时前
Oracle 11g Active Data Guard Go 自动化部署工具 v1.0
数据库·oracle
Nturmoils12 小时前
自增主键别只会 auto_increment,先把值从哪来讲清楚
数据库·后端