starrocks集群fe/be节点进程守护脚本

自建starrocks集群,有时候服务会挂掉,无法自动拉起服务,于是采用supervisor进行进程守护。可能是版本的原因,supervisor程序总是异常,无法对fe//be进行守护。于是写了个简易脚本。

bash 复制代码
#!/bin/bash
AppNameFe=com.starrocks.StarRocksFE
AppPortFe=9030
AppNameBe=starrocks_be
AppPortBe=9050
Dtime="$(date +%Y%m%d%H%M%S)"

while true
do
    #这里查询指定的app是否运行,查询的时候去除包含grep的结果,如果没有改进程,返回空字符串
    appFind=`ps -ef | grep ${AppNameFe} | grep -v grep`
    appRunid=`ss -tlnp|grep ${AppPortFe}|awk -F',' '{print $2}'|awk -F'=' '{print $2}'`
    findNum=${#appFind}
    findPort=${#appRunid}
    if [ ${findNum} -lt 1 ] | [ ${findPort} -lt 1 ];then
    #相对路径,执行与shell脚本同目录下的程序
       echo "$Dtime fe进程异常,${AppPortFe} 端口不存在,现拉起服务..." >> /tmp/programfude.log
       /opt/StarRocks/fe/bin/stop_fe.sh
       sleep 3s
       /opt/StarRocks/fe/bin/start_fe.sh --daemon 
    fi
    #这里查询指定的app是否运行,查询的时候去除包含grep的结果,如果没有改进程,返回空字符串
    appFind=`ps -ef | grep ${AppNameBe} | grep -v grep`
    appRunid=`ss -tlnp|grep ${AppPortBe}|awk -F',' '{print $2}'|awk -F'=' '{print $2}'`
    findNum=${#appFind}
    findPort=${#appRunid}
    if [ ${findNum} -lt 1 ] | [ ${findPort} -lt 1 ];then
    #相对路径,执行与shell脚本同目录下的程序
       echo "$Dtime be进程异常,${AppPortBe}端口不存在,现拉起服务..." >> /tmp/fudeservice.log
       /opt/StarRocks/be/bin/stop_be.sh
       sleep 3s
       /opt/StarRocks/be/bin/start_be.sh --daemon 
    fi 
    #每30秒查询一次,所以sleep60,根据所需调整,单位为秒
    sleep 30
done
bash 复制代码
chmod +x processdaemon.sh
nohup ./processdaemon.sh &
相关推荐
磊灬泽1 小时前
【日常错误】鼠标无反应
linux·windows
Miracle&5 小时前
2.TCP深度解析:握手、挥手、状态机、流量与拥塞控制
linux·网络·tcp/ip
专注API从业者5 小时前
Python/Java 代码示例:手把手教程调用 1688 API 获取商品详情实时数据
java·linux·数据库·python
Ribou6 小时前
Ubuntu 24.04.2安装k8s 1.33.4 配置cilium
linux·ubuntu·kubernetes
tan180°7 小时前
Boost搜索引擎 网络库与前端(4)
linux·网络·c++·搜索引擎
Mr. Cao code7 小时前
Docker:颠覆传统虚拟化的轻量级革命
linux·运维·ubuntu·docker·容器
抓饼先生8 小时前
Linux control group笔记
linux·笔记·bash
挺6的还8 小时前
25.线程概念和控制(二)
linux
您的通讯录好友8 小时前
conda环境导出
linux·windows·conda
代码AC不AC9 小时前
【Linux】vim工具篇
linux·vim·工具详解