starrocks集群fe/be节点进程守护脚本

自建starrocks集群,有时候服务会挂掉,无法自动拉起服务,于是采用supervisor进行进程守护。可能是版本的原因,supervisor程序总是异常,无法对fe//be进行守护。于是写了个简易脚本。

bash 复制代码
#!/bin/bash
AppNameFe=com.starrocks.StarRocksFE
AppPortFe=9030
AppNameBe=starrocks_be
AppPortBe=9050
Dtime="$(date +%Y%m%d%H%M%S)"

while true
do
    #这里查询指定的app是否运行,查询的时候去除包含grep的结果,如果没有改进程,返回空字符串
    appFind=`ps -ef | grep ${AppNameFe} | grep -v grep`
    appRunid=`ss -tlnp|grep ${AppPortFe}|awk -F',' '{print $2}'|awk -F'=' '{print $2}'`
    findNum=${#appFind}
    findPort=${#appRunid}
    if [ ${findNum} -lt 1 ] | [ ${findPort} -lt 1 ];then
    #相对路径,执行与shell脚本同目录下的程序
       echo "$Dtime fe进程异常,${AppPortFe} 端口不存在,现拉起服务..." >> /tmp/programfude.log
       /opt/StarRocks/fe/bin/stop_fe.sh
       sleep 3s
       /opt/StarRocks/fe/bin/start_fe.sh --daemon 
    fi
    #这里查询指定的app是否运行,查询的时候去除包含grep的结果,如果没有改进程,返回空字符串
    appFind=`ps -ef | grep ${AppNameBe} | grep -v grep`
    appRunid=`ss -tlnp|grep ${AppPortBe}|awk -F',' '{print $2}'|awk -F'=' '{print $2}'`
    findNum=${#appFind}
    findPort=${#appRunid}
    if [ ${findNum} -lt 1 ] | [ ${findPort} -lt 1 ];then
    #相对路径,执行与shell脚本同目录下的程序
       echo "$Dtime be进程异常,${AppPortBe}端口不存在,现拉起服务..." >> /tmp/fudeservice.log
       /opt/StarRocks/be/bin/stop_be.sh
       sleep 3s
       /opt/StarRocks/be/bin/start_be.sh --daemon 
    fi 
    #每30秒查询一次,所以sleep60,根据所需调整,单位为秒
    sleep 30
done
bash 复制代码
chmod +x processdaemon.sh
nohup ./processdaemon.sh &
相关推荐
yuanmenghao18 分钟前
Linux 性能实战 | 第 7 篇 CPU 核心负载与调度器概念
linux·网络·性能优化·unix
qq_2975746731 分钟前
Linux 服务器 Java 开发环境搭建保姆级教程
java·linux·服务器
70asunflower1 小时前
Emulation,Simulation,Virtualization,Imitation 的区别?
linux·docker
神梦流2 小时前
GE 引擎的内存优化终局:静态生命周期分析指导下的内存分配与复用策略
linux·运维·服务器
凡人叶枫2 小时前
C++中输入、输出和文件操作详解(Linux实战版)| 从基础到项目落地,避坑指南
linux·服务器·c语言·开发语言·c++
wdfk_prog2 小时前
[Linux]学习笔记系列 -- [drivers][input]serio
linux·笔记·学习
xuhe22 小时前
[全流程详细教程]Docker部署ClawBot, 使用GLM4.7, 接入TG Bot实现私人助理. 解决Docker Openclaw Permission Denied问题
linux·docker·ai·github·tldr
Lsir10110_2 小时前
【Linux】进程信号(下半)
linux·运维·服务器
酉鬼女又兒3 小时前
零基础入门Linux指南:每天一个Linux命令_pwd
linux·运维·服务器
云飞云共享云桌面3 小时前
高性能图形工作站的资源如何共享给10个SolidWorks研发设计用
linux·运维·服务器·前端·网络·数据库·人工智能