公司今年开始了大批量的裁员,人心惶惶,所以强迫自己学习点新知识,刚好领导给找了个事情,让写个脚本实现一键启停Linux服务器上的服务,于是开始研究这个怎么搞。
最开始的时候,有点想当然了,觉得一键启停不就是写个菜单,调用一下服务启动停止的命令就可以实现,但是在写的过程中,发现全是坑,搞的心态都崩了,所以目前先写了一个脚本应付一下领导,当然了这个脚本也比较简单,适用性也有一定的局限性,不过也还是可以参考复用的,我会把局限性在最下边做个简单的说明。
好了 废话不多说,直接上代码, 我会在关键的地方给写注释,说明一下方式方法,后边如果有不懂的评论就行
#!/bin/bash
###################################
# #
# OWNER: 一袭白衣一 #
# #
# TIME:2024/8 #
# #
# version:1.0 #
# #
###################################
#清屏,好看点,不多说了哈
clear
#声明个数组存储数据
declare -A services
#数组的样例哈
services=(
["服务1"]="服务所在的路径(到启动脚本所在的那一级),服务启动脚本所在路径(包含了启动脚本),服务名(进程里显示的那个),服务停止命令,打印日志所在路径(包含日志文件)"
["服务2"]="服务所在的路径(到启动脚本所在的那一级),服务启动脚本所在路径(包含了启动脚本),服务名(进程里显示的那个),服务停止命令,打印日志所在路径(包含日志文件)"
["服务3"]="服务所在的路径(到启动脚本所在的那一级),服务启动脚本所在路径(包含了启动脚本),服务名(进程里显示的那个),服务停止命令"
#后边可以放多个服务信息
)
#这块不多说了哈,就是去数组里获取启动脚本路径,调用启动命令启动服务
start_service() {
#声明一个变量从数组内拿相关信息,用于后边调用
local service_path=$(echo ${services[$1]} | cut -d',' -f1)
local start_script=$(echo ${services[$1]} | cut -d',' -f2)
echo "Starting $1 at $service_path......"
cd $service_path
$start_script start || { echo "Failed to start $1"; return 1; }
}
#停止服务的模块,这部分有点特殊,我这边是因为有个服务的停止命令不是stop,是shutdown,所以做了个判断
#如果你们也有这样的情况,可以在这个地方做修改,没有的话,可以把中间的这个if拿掉
stop_service() {
#声明一个变量从数组内拿相关信息,用于后边调用
local service_path=$(echo ${services[$1]} | cut -d',' -f1)
local stop_script=$(echo ${services[$1]} | cut -d',' -f2)
local service_name=$(echo ${services[$1]} | cut -d',' -f3)
echo "Stopping $1 with: $service_path......"
cd $service_path
#这个if模块不需要可以拿掉
if [ "$service_name" == "特殊的服务" ];
then
$stop_script shutdown || { echo "Failed to stop $1"; return 1; }
else
$stop_script stop || { echo "Faild to stop $1"; return 1; }
fi
}
#重启模块了哈,这个就更简单, 我就是重复调用了一遍stop、start模块
restart_service() {
local service_name=$1
#如果服务状态正常,就先停止,再启动,否则就直接启动
if check_service_status $service_name; then
stop_service $service_name
fi
start_service $service_name
}
#检查服务的状态,我这边用的是ps命令。直接查看进程里的服务是否存在,判断服务是否存活
check_service_status() {
local process_name=$(echo ${services[$1]} | cut -d',' -f3)
if pgrep -u $(whoami) -f "$process_name" > /dev/null; then
echo "$1 is already running."
return 0
else
echo "$1 is not running."
return 1
fi
}
#这块也是特殊服务用到的,有个服务启动的时间太长了所以必须要打印日志。。。。
#如果想让所有的服务都打印日志,可以在下边去掉判断,我会标注
#tail appserver&dbbackup log after them start
watch_log(){
local service_name=$1
local log_file=$(echo ${services[$service_name]} | cut -d',' -f5)
if [ -n "$log_file" ];
then
echo "Now Show log for $service_name: $log_file"
trap " echo 'Now Stop Show log for $service_name'; return" SIGINT
tail -f $log_file
else
echo "No log to show "
fi
}
#服务的list,用于check服务状态
service_processes_list() {
for service in "${!services[@]}"; do
echo "Showing the service processes for $service"
check_service_status $service
done
}
#主菜单展示,linux 的脚本就这样,丑点就丑点,好用就行
while true; do
echo "#################################"
echo "#****Services Control Menu******#"
echo "# #"
echo "# 1. Start Server #"
echo "# 2. Stop Server #"
echo "# 3. Restart Server #"
echo "# 4. Check Service status #"
echo "# 5. Exit menu #"
echo "#################################"
read -p "Please select an option: " option
#进入实际的菜单功能模块了哈
case $option in
1)
while true; do
echo "Select a service to start:"
select service in "${!services[@]}" "Back to main menu"; do
case $service in
"Back to main menu")
break 2
;;
*)
if [ -n "$service" ]; then
start_service $service
sleep 3
#这个地方就是我说的特殊处理的,这两个特殊服务需要打印日志,不能仅通过进程判断是否启动正常
#如果想打印所有服务的日志,可以把这块的判断拿掉
if [[ "$service" == "特殊服务1" || "$service" == "特殊服务2" ]];
then
watch_log $service
fi
echo "Press any key to continue..."
read -n 1 -s
break
else
echo "Invalid option, please try again."
fi
;;
esac
done
done
;;
2)
while true; do
echo "Select a service to stop:"
select service in "${!services[@]}" "Back to main menu"; do
case $service in
"Back to main menu")
break 2
;;
*)
if [ -n "$service" ]; then
if check_service_status $service; then
#停止服务前,做了个提示,省的瞎搞误操作把生产环境服务停了。。。
read -p "Are you sure want to stop $service ? (Y/N):" confirm
if [ "$confirm" == "Y" ];
then
stop_service $service
sleep 3
fi
else
echo "$service is not running."
fi
echo "Press any key to continue..."
read -n 1 -s
break
else
echo "Invalid option, please try again."
fi
;;
esac
done
done
;;
3)
while true; do
echo "Select a service to restart:"
select service in "${!services[@]}" "Back to main menu"; do
case $service in
"Back to main menu")
break 2
;;
*)
if [ -n "$service" ]; then
restart_service $service
sleep 3
#这个地方跟上边一样,就是专门给特殊服务做的,不需要可以拿掉
if [[ "$service" == "特殊服务1" || "$service" == "特殊服务2" ]];
then
watch_log $service
fi
echo "Press any key to continue..."
read -n 1 -s
break
else
echo "Invalid option, please try again."
fi
;;
esac
done
done
;;
4)
service_processes_list
sleep 3
echo "Press any key to continue..."
read -n 1 -s
;;
5)
exit 0
;;
*)
echo "Invalid option, please try again."
;;
esac
done
上边的这个脚本,至少目前我在用的时候,是挺好用的,存在的不足后边在使用过程中一边发现一边更新吧,现在来说说这个脚本的局限性
第一:这个脚本如果在不修改代码的情况下,仅适用于启停命令为start stop/shutdown的服务
第二:这个脚本暂时还无法记录操作日志,即谁执行的脚本,执行的记录暂时没有存储,所以只能说慎重操作
第三:这个脚本暂时没有添加一键启停模块,后边我会再做修改,争取增加一键启动停止重启的功能,这样更便于运维
第四:这个脚本如果想要跨服务器使用的话,需要修改对应的服务信息等,还是不够便携
说完不足了,说说后边的想法吧,这个脚本我还会进一步更新(如果能帮到大家的话,我会在论坛再次更新修改版),然后这个脚本实现的功能领导不太满意,领导觉得太麻烦,想让我搞个一键脚本,并且这个脚本适用于所有服务器,就是把脚本扔在任何一台服务器上,都可以运行。。。。(当然了,前提是我们自己的服务器)。
真是一个头两个大,后边想想怎么搞,目前已经有了一点思路,在这里也跟大家提前分享一下:
首先这个脚本想要适用所有的服务器(我们的),那首先脚本要识别服务器ip,不同的服务器上有不同的服务(例如主、备、BCP服务啊这些),那还要识别主、备这样的服务类别,其实这样的话,最好的方式是把所有服务的信息以及服务器信息放在一个文件内,通过脚本识别服务器,然后去读取文件里对应的信息,大概这样的话应该可以。
就先这样吧,后边有更新了再发,欢迎大家批评指导-。-