使用Shell脚本实现Linux系统资源监控邮件告警

前言

[1. 问题背景与需求](#1. 问题背景与需求)

[2. Bash 脚本监控资源](#2. Bash 脚本监控资源)

[3. Bash 脚本判断阈值](#3. Bash 脚本判断阈值)

[4. 配置 msmtp 发送邮件](#4. 配置 msmtp 发送邮件)

[4.1 安装 msmtp](#4.1 安装 msmtp)

[4.2 创建配置文件 /etc/msmtprc](#4.2 创建配置文件 /etc/msmtprc)

[5. 发送邮件](#5. 发送邮件)

[5.1 给别人发邮件](#5.1 给别人发邮件)

[6. 完整示例脚本](#6. 完整示例脚本)

[7. 测试方法](#7. 测试方法)

[8. 常见问题解答](#8. 常见问题解答)

[9. 总结](#9. 总结)

前言

在运维过程中,监控服务器的 CPU、内存和磁盘使用率非常重要。当资源使用率过高时,及时收到邮件告警可以避免服务中断。本文将结合实践,详细讲解如何用 Bash 脚本监控系统资源,并通过 msmtp 发送邮件告警。


1. 问题背景与需求

  • 监控目标

    • CPU 使用率

    • 内存使用率

    • 磁盘使用率

  • 告警条件:当任意资源使用率超过阈值时发送邮件

  • 邮件需求

    • 发送到指定收件人(自己或他人邮箱)

    • 邮件包含主题和正文

    • 邮件通过自己的 SMTP 账户发送(例如 QQ 邮箱)


2. Bash 脚本监控资源

获取系统资源使用率的常用命令如下:

复制代码
# CPU 使用率 
cpu_use=$(top -bn1 | grep "Cpu(s)" | awk -F, '{print 100 - $4}' | awk -F. '{print $1}')

说明

  • top -bn1:以批处理模式(非交互)输出一次 CPU 和内存状态

  • grep "Cpu(s)":筛选包含 CPU 信息的行

  • awk -F, '{print 100 - $4}'$4%id(CPU 空闲百分比),用 100 - $4 计算 CPU 使用率

  • awk -F. '{print $1}':取整数部分,方便比较阈值

    内存使用率

    mem_use=(free | awk '/Mem/{print 3/2 * 100}' | awk -F. '{print 1}')

说明

  • free:显示内存使用情况

  • awk '/Mem/{print $3/$2 * 100}'$3 是已用内存,$2 是总内存,计算百分比

  • awk -F. '{print $1}':取整数部分

    根目录磁盘使用率

    disk_use=(df / | awk 'END{print 5}' | sed 's/%//')

说明

  • df /:查看根目录分区使用情况

  • awk 'END{print $5}':取最后一行(分区行)的第五列(使用率)

  • sed 's/%//':去掉百分号,方便比较


3. Bash 脚本判断阈值

设置阈值,并将告警信息拼接到变量 ALERT_MSG

复制代码
CPU_WARNING=80 
MEM_WARNING=80 
DISK_WARNING=80 
ALERT_MSG="" 
# CPU告警判断
if [ "$cpu_use" -ge "$CPU_WARNING" ]; then 
ALERT_MSG+="CPU使用率:${cpu_use}%超过阈值${CPU_WARNING}%\n" 
fi

说明

  • [ "$cpu_use" -ge "$CPU_WARNING" ]:判断 CPU 是否大于等于阈值

  • ALERT_MSG+=:追加告警信息

  • \necho -e 输出时换行

类似逻辑用于内存和磁盘判断。


4. 配置 msmtp 发送邮件

4.1 安装 msmtp

复制代码
# CentOS/RHEL 
sudo yum install msmtp -y 
# Ubuntu/Debian
sudo apt install msmtp -y 

说明

  • msmtp 是轻量级 SMTP 客户端

  • 支持管道输入,将文本内容发送为邮件正文

4.2 创建配置文件 /etc/msmtprc

复制代码
defaults 
auth on # 开启认证 
tls on # 开启 TLS 加密 
tls_trust_file /etc/ssl/certs/ca-bundle.crt # CA 证书路径 
logfile /var/log/msmtp.log # 日志文件 

account qq 
host smtp.qq.com # SMTP 服务器地址 
port 587 # SMTP 端口 
from 3426848201@qq.com # 发件人邮箱 
user 3426848201@qq.com # SMTP 用户名 
password zqhvzueytjhncjae # SMTP 授权码 

account default : qq # 默认账户

说明

  • 日志文件 使用绝对路径,避免 ~ 不被解析

  • 权限必须设置为 600:chmod 600 /etc/msmtprc

  • account default : qq 表示默认发送账户


5. 发送邮件

msmtp 需要在邮件内容里写主题:

复制代码
if [ -n "$ALERT_MSG" ]; then 
    ( 
        echo "Subject: 服务器资源告警" 
        echo # 空行,分隔邮件头和正文 
        echo -e "$ALERT_MSG" # 邮件正文 
    ) | msmtp "$MAIL_TO" 
fi

说明

  • if [ -n "$ALERT_MSG" ]:仅当有告警信息时发送邮件

  • echo "Subject: ...":邮件主题

  • echo:空行分隔邮件头和正文

  • echo -e "$ALERT_MSG":输出正文,支持换行


5.1 给别人发邮件

复制代码
MAIL_TO="friend@example.com" 
        ( 
            echo "From: 3426848201@qq.com" 
            echo "To: friend@example.com" 
            echo "Subject: 服务器资源告警" 
            echo echo -e "$ALERT_MSG" 
        ) | msmtp -t

说明

  • -t 告诉 msmtp 从邮件头读取收件人

  • 可以一次发给多人,用逗号或空格隔开


6. 完整示例脚本

复制代码
#!/bin/bash
#系统资源监控脚本

#配置邮箱信息
MAIL_TO="3426848201@qq.com" #收件人邮箱

#邮件标题
TITLE="服务器资源告警"

#获取CPU使用率
cpu_use=$(top -bn1 | grep "Cpu(s)" | awk -F, '{print 100 - $4}' | awk -F. '{print $1}')
#获取磁盘使用率
disk_use=$(df / | awk 'END{print $5}' | sed 's/%//')
#获取内存使用率
mem_use=$(free | awk '/Mem/{print $3/$2 * 100}' | awk -F. '{print $1}')

#设置告警阈值
CPU_WARNING=1
MEM_WARNING=1
DISK_WARNING=1

#用于保存监控信息
ALERT_MSG=""

#判断CPU
if [ "$cpu_use" -ge "$CPU_WARNING" ]; then
     ALERT_MSG+="CPU使用率:${cpu_use}%超过阈值${CPU_WARNING}%\n"
fi
#判断内存
if [ "$mem_use" -ge "$MEM_WARNING" ]; then
    ALERT_MSG+="内存使用率:${mem_use}%超过阈值${MEM_WARNING}%\n"
fi
#判断磁盘
if [ "$disk_use" -ge "$DISK_WARNING" ]; then
   ALERT_MSG+="磁盘使用率:${disk_use}%超过阈值${DISK_WARNING}%\n"
fi

#如果有告警就发邮件
if [ -n "$ALERT_MSG" ]; then
   (
      echo "Subject: $TITLE"
      echo
      echo -e "$ALERT_MSG"
   ) | msmtp "$MAIL_TO"
fi

7. 测试方法

  1. 将阈值调低,例如 1%,确保告警触发

  2. 执行脚本:

    复制代码
    sh Cpu内存监控.sh
  3. 检查收件邮箱,确认主题和正文显示正确

注意:可使用crontab -e

*/5 * * * * /bin/bash /path(脚本路径)/shname.sh(脚本名)

实现全自动监控,如遇执行失败,请检查脚本是否有执行权限,没有可用chmod提权


8. 常见问题解答

问题 原因 解决方法
收到空邮件 $ALERT_MSG 为空,或邮件头和正文没有空行 确保告警信息非空,邮件头与正文间加空行
收到无主题邮件 msmtp 不会自动加主题 在邮件内容第一行写 Subject:
msmtp: input error 配置文件有语法错误或使用 ~ 使用绝对路径、保持 Unix 换行格式、权限 600
无法发送邮件 SMTP 配置错误 确认 hostportuserpassword 正确,使用授权码

9. 总结

  • Bash + msmtp 可以实现轻量级系统资源监控邮件告警

  • 邮件头、主题和正文必须正确,否则收件人可能看到空邮件或无主题

  • 可以扩展支持多收件人、日志记录和定时任务

相关推荐
EleganceJiaBao6 小时前
【Neovim】Vi、Vim、Neovim 与 LazyVim:发展史
linux·编辑器·vim·vi·neovim·lazyvim
Bruce_Liuxiaowei6 小时前
Linux系统提权之计划任务(Cron Jobs)提权
linux·运维·服务器·网络安全·系统安全
会飞的小蛮猪6 小时前
Jenkins运维之路(自动获得分支tag&自动构建)
运维·经验分享·ci/cd·jenkins
czhc11400756636 小时前
Linux 96 shell:expect { }
linux·运维·服务器
2501_930124706 小时前
编辑shell脚本示例练习
linux·服务器·github
幂简集成6 小时前
基于 Gemini 的 CI/CD 自动化测评 API 集成实战教程
运维·ci/cd·自动化
焦思懿--19期--工职大6 小时前
VMWare和centOS的安装
linux·运维·centos
TG_yunshuguoji8 小时前
阿里云国际代理:阿里云的云数据库是什么?
服务器·数据库·安全·阿里云·云计算
那小子、真烦8 小时前
配置阿里云 YUM 源指南
linux·运维