NoSQL之redis哨兵

一、哨兵的核心功能

  1. 监控(Monitoring)

    • 持续检查主节点和从节点的运行状态(是否存活、延迟等)。
  2. 自动故障转移(Automatic Failover)

    • 当主节点不可用时,自动选举一个从节点升级为主节点。

    • 更新其他从节点和客户端的配置指向新主节点。

  3. 配置提供(Configuration Provider)

    • 客户端通过哨兵获取当前的主节点地址(无需手动修改配置)。
  4. 通知(Notification)

    • 通过 API 或脚本发送集群状态变化的告警(如邮件、短信)。

二、哨兵的工作原理

1. 监控机制
  • 每个哨兵每秒向所有节点(主/从/其他哨兵)发送 PING 命令。

  • 若节点在 down-after-milliseconds 时间内未响应,哨兵将其标记为主观下线(Subjectively Down)

  • 多个哨兵 (需达到 quorum 数量)都认为主节点主观下线,则主节点被标记为客观下线(Objectively Down)

2. 选举领导者哨兵
  • 主节点客观下线后,哨兵们通过 Raft 算法 选举一个领导者哨兵(Leader Sentinel)来执行故障转移。
3. 故障转移流程
  1. 领导者哨兵选择一个合适的从节点(如数据最新、优先级高)。

  2. 向该从节点发送 SLAVEOF NO ONE 命令,使其成为新主节点。

  3. 向其他从节点发送 SLAVEOF <new-master-ip> <new-master-port>,指向新主节点。

  4. 将旧主节点更新为从节点(若恢复则自动切换角色)。


三、部署建议

  1. 最少部署 3 个哨兵节点(避免脑裂,需奇数台)。

  2. 哨兵分散在不同物理服务器(防单点故障)。

  3. 配置参数示例:

    复制代码
    sentinel monitor mymaster 192.168.1.10 6379 2  # 监控主节点,2表示quorum
    sentinel down-after-milliseconds mymaster 5000 # 5秒无响应判为主观下线
    sentinel failover-timeout mymaster 60000       # 故障转移超时60秒

四、客户端如何配合哨兵?

客户端需通过哨兵获取主节点地址,而不是直连主节点。流程如下:

  1. 连接任意哨兵节点,发送命令:

    复制代码
    SENTINEL get-master-addr-by-name <master-name>
  2. 获取当前主节点 IP 和端口后建立连接。

  3. 订阅哨兵的 +switch-master 事件,及时感知主节点切换。


五、哨兵的优势与限制

优势 限制
自动故障转移,服务高可用 不解决数据分片(需配合 Redis Cluster)
配置集中管理,客户端透明 故障转移期间可能有少量数据丢失
支持多哨兵部署,避免单点故障 网络分区时可能出现脑裂(需合理配置)

六、常见命令

复制代码
# 查看主节点信息
SENTINEL masters

# 查看从节点信息
SENTINEL slaves <master-name>

# 手动触发故障转移(测试用)
SENTINEL failover <master-name>

七、注意事项

  1. 避免脑裂(Split-Brain) :确保 quorum 值 > 哨兵总数/2(如 3 个哨兵设 quorum=2)。

  2. 合理设置超时down-after-milliseconds 根据网络延迟调整(通常 5-30 秒)。

  3. 版本一致性:所有节点使用相同 Redis 版本(避免兼容问题)。

相关推荐
她说..2 小时前
Java 对象相关高频面试题
java·开发语言·spring·java-ee
汀、人工智能3 小时前
[特殊字符] 第21课:最长有效括号
数据结构·算法·数据库架构·图论·bfs·最长有效括号
Boop_wu3 小时前
[Java 算法] 字符串
linux·运维·服务器·数据结构·算法·leetcode
庞轩px3 小时前
深入理解 sleep() 与 wait():从基础到监视器队列
java·开发语言·线程··wait·sleep·监视器
徐小夕3 小时前
我用 AI 撸了个开源"万能预览器":浏览器直接打开 Office、CAD 和 3D 模型
前端·vue.js·github
故事和你913 小时前
洛谷-算法1-2-排序2
开发语言·数据结构·c++·算法·动态规划·图论
小码哥_常3 小时前
Flutter Android 延迟加载代码指南:提升应用性能的关键
前端
Fcy6484 小时前
算法基础详解(三)前缀和与差分算法
算法·前缀和·差分
皮皮林5514 小时前
面试官:ZSet 的底层实现是什么?
java
这是个栗子4 小时前
TypeScript(三)
前端·javascript·typescript·react