keepalive详解

一、简介

  • 介绍:Keepalived是Linux下一个轻量级别的高可用解决方案。中文名称:存活检测机制。起初针对LVS进行研发,专门用来监控集群系统中各个服务节点的状态。如果负载调度器出现故障,keepalive检测到以后将故障点直接从集群中剔除。
  • 作用:支持故障自动切换、支持节点健康状态检查
  • 原理:心跳检测

二、VRRP协议(虚拟路由冗余协议)

VRRP是一种容错协议,它通过把几台路由设备联合组成一台虚拟的路由设备,并通过一定的机制来保证当主机的下一跳设备出现故障时,可以及时将业务切换到其它设备,从而保持通讯的连续性和可靠性。

VRRP将局域网内的一组路由器划分在一起,称为一个备份组。备份组由一个Master路由器和多个Backup路由器组成,功能上相当于一台虚拟路由器。局域网内的主机只需要知道这个虚拟路由器的IP地址,并不需知道具体某台设备的IP地址,将网络内主机的缺省网关设置为该虚拟路由器的IP地址,主机就可以利用该虚拟网关与外部网络进行通信。

VRRP将该虚拟路由器动态关联到承担传输业务的物理路由器上,当该物理路由器出现故障时,再次选择新路由器来接替业务传输工作,整个过程对用户完全透明,实现了内部网络和外部网络不间断通信。

三、keepalive的工作流程

  • Initialize模式

    • 设备启动时进入此状态,当收到接口Startup的消息,将转入Backup或Master状态(IP地址拥有者的接口优先级为255,直接转为Master)。在此状态时,不会对VRRP报文做任何处理。
  • Master模式

    • 定期发送 VRRP 报文
    • 以虚拟 MAC 地址响应对虚拟 IP 地址的 ARP 请求
    • 转发目的标MAC 地址为虚拟 MAC 地址的 IP 报文
    • 如果它是这个虚拟 IP 地址的拥有者,则接收目的 IP 地址为这个虚拟 IP 地址的 IP 报文。否则,丢弃这个 IP 报文
    • 如果收到比自己优先级大的报文则转为 Backup 状态
    • 如果收到优先级和自己相同的报文,并且发送端的 IP 地址比自己的 IP 地址大,则转为 Backup 状态
    • 当接收到接口的 Shutdown 事件时,转为Initialize(初始状态)
  • Backup模式

    • 接收 Master 发送的 VRRP 报文,判断 Master 的状态是否正常
    • 对虚拟 IP 地址的 ARP 请求,不做响应
    • 丢弃目的 MAC 地址为虚拟 MAC 地址的 IP 报文
    • 丢弃目的 IP 地址为虚拟 IP 地址的IP报文
    • Backup 状态下如果收到比自己优先级小的报文时,丢弃报文,立即切换为 Master( 仅在抢占模式下生效 )
    • 如果收到优先级和自己相同或者比自己高的报文,则重置定时器,不进一步比较 IP 地址
    • 当接收到接口的 Shutdown 事件时,转为 Initialize
    • 如果 MASTER_DOWN_INTERVAL 定时器超时,则切换为 Master

四、脑分裂及其解决方案

  • 原因:、

    • 硬件----连接线、网卡或相关驱动、连接线间的设备(交换机)、
    • 防火墙
    • 配置的网卡信息不正确
  • 方案

    • 使用串口线进行连接,避免线路问题。
    • 使用特殊设备进行支撑,当备份节点成为主节点时主动杀死另一台keeepalive
    • 对iptables进行设置,开放环境中使用的IP
    • 通过zabbix对keepalive进行监测

五、keepalive的各项功能

  • 后端节点健康状态检测

    • 目的:搭配LVS使用,当后端节点出现故障时。主动剔除出集群,使集群后端节点出现故障时用户可以较为畅通的访问相应的资源
  • 脚本调用

    • 脚本所在目录:/etc/keepalive/script/

    • 服务检测脚本:

      • 当keepalive对其他服务(非LVS)进行高可用时,使服务器出现故障时可迅速切换至从节点,使用户仍可以正常访问后端真实服务器
      • 切换至主节点脚本:当从节点承当负载调度器的角色时,需获取一些资源,比如目录的挂载
      • 切换至关闭状态脚本:当该服务器需要关闭时,需释放一些资源,以免多台调度器同时写入某文件以致文件损坏
  • 非抢占模式

    • 在主节点和备份节点性能相差不大时采用非抢占模式,可减少资源的浪费和提升用户体验(减少用户不能使用的时间)
    • 在非抢占模式中,配置文件中应都为备份模式
相关推荐
_.Switch1 小时前
高级Python自动化运维:容器安全与网络策略的深度解析
运维·网络·python·安全·自动化·devops
qq_254674411 小时前
工作流初始错误 泛微提交流程提示_泛微协同办公平台E-cology8.0版本后台维护手册(11)–系统参数设置
网络
JokerSZ.1 小时前
【基于LSM的ELF文件安全模块设计】参考
运维·网络·安全
小松学前端4 小时前
第六章 7.0 LinkList
java·开发语言·网络
城南vision4 小时前
计算机网络——TCP篇
网络·tcp/ip·计算机网络
Ciderw5 小时前
块存储、文件存储和对象存储详细介绍
网络·数据库·nvme·对象存储·存储·块存储·文件存储
Tony聊跨境5 小时前
独立站SEO类型及优化:来检查这些方面你有没有落下
网络·人工智能·tcp/ip·ip
2403_875736876 小时前
道品科技智慧农业中的自动气象检测站
网络·人工智能·智慧城市
Tassel_YUE8 小时前
网络自动化04:python实现ACL匹配信息(主机与主机信息)
网络·python·自动化