Redis 哨兵（Sentinel）原理

在 Redis 高可用架构中，哨兵（Sentinel） 扮演着至关重要的角色。它不仅能自动监控主从节点状态，还能在主节点故障时完成自动切换，保障服务持续可用。本文将系统梳理 Sentinel 的核心机制。

Redis Sentinel 主要提供以下三大能力：

💡 注意：Sentinel 不负责数据存储，仅用于管理与协调。

Sentinel 通过一套严谨的心跳 + 投票机制判断节点是否真正失效：

心跳检测

默认每 1 秒向所有 Redis 节点发送 PING 命令。若在 down-after-milliseconds（默认 30 秒）内未收到有效响应，则该哨兵将节点标记为 主观下线（SDOWN）。
主观下线（SDOWN）

单个哨兵认为节点不可用，但不足以触发故障转移。
客观下线（ODOWN）

当 ≥ quorum 个哨兵 都报告 SDOWN 时，Sentinel 集群将该 master 标记为 客观下线（ODOWN），正式进入故障恢复流程。

✅ 关键提示 ：
quorum 仅用于判定 ODOWN，Leader 选举仍需获得多数派支持（> N/2） 。例如 3 个哨兵，quorum=2 可触发 ODOWN，但选 Leader 仍需至少 2 票。

一旦 master 被标记为 ODOWN，Sentinel 就会在 slave 中选举新的主节点。

并非所有 slave 都有资格参选，首先排除以下两类：

满足基本条件后，按以下顺序择优：

故障转移操作只能由一个哨兵执行，因此需要先选出 Leader。

⚠️ 常见误解：

"谁先发现 master 下线，谁就当 Leader" ------ 这是错误的！

实际采用类似 Raft 的共识机制，需经过一轮正式投票，不是"先到先得"。

Leader 选出后，开始执行故障转移的重配置流程：

向新 master 发送命令：

Redis 4.0 及以下 SLAVEOF no one

Redis 5.0 及以上 REPLICAOF no one
向其他 slave 发送命令：

Redis 4.0 及以下 SLAVEOF<new_master_ip> <port>

Redis 5.0 及以上 REPLICAOF <new_master_ip> <port>
原 master 重启后 ：

Sentinel 会主动连接它，并发送 REPLICAOF <new_master>，将其降级为 slave。

🔒 重要：不会修改其 redis.conf 配置文件，角色切换完全通过运行时指令完成。
通知客户端：
- 通过 Pub/Sub 发布 +switch-master 事件
- 客户端可调用 API 查询：
  bash 复制代码
```
SENTINEL get-master-addr-by-name mymaster
```

为确保 Sentinel 稳定可靠，推荐遵循以下原则：

✅ 总结：

Redis Sentinel 通过"监控 → 判定 → 选举 → 通知"四步闭环，实现了 Redis 主从架构的自动高可用。理解其原理，是构建稳定缓存系统的基石。

作者：不会写程序的未来程序员

首发于 CSDN 欢迎点赞、收藏、评论交流！

版权声明：本文为原创文章，转载请注明出处。