Grafana配置告警规则推送企微机器人服务器资源告警

前提

已经部署Grafana,并且dashboard接入数据

大屏编号地址:Node Exporter Full | Grafana Labs

创建企微机器人

备注:群里若有第三方外部人员不能创建

机器人创建完成,记录下来Webhook地址

Grafana配置告警消息模板

bash 复制代码
{{ define "KDDI" }}
{{ range $i,$alert :=.Alerts }}
===KDDI资源使用率监控报警===
告警状态:{{ if eq .Status "firing" }} <font color="#FF0000">触发告警</font> {{ else if eq .Status "resolved" }} <font color="#00FF00">告警解除</font>{{ end }}
告警级别:{{ .Labels.level }}
告警类型:{{ .Labels.alertname }}
故障主机:{{ if eq .Labels.instance "123.56.222.147:9100" }} <font color="#0000FF" style="font-weight:bold;">123.56.222.147</font> {{ else if eq .Labels.instance "47.94.168.75:9100" }} <font color="#0000FF" style="font-weight:bold;">47.94.168.75</font>{{ end }}
告警主题:{{ .Annotations.summary }}
告警详情:{{ .Annotations.description }}
触发时间:{{  .StartsAt.Local.Format "2006-01-02 15:40:12" }}
==========end==========
{{  end }}
{{  end }}

Grafana配置企微机器人

选择告警消息模板,配置告警title,保存

Grafana配置panelCPU告警规则(阈值80)

bash 复制代码
100 - (avg by (instance,job)(irate(node_cpu_seconds_total{mode="idle"}[5m])) * 100)

保存退出

查看企微告警消息

内存和磁盘配置跟CPU基本一样,查询语句分别如下

bash 复制代码
CPU
100 - (avg by (instance,job)(irate(node_cpu_seconds_total{mode="idle"}[5m])) * 100)

内存
(1 - (node_memory_MemAvailable_bytes)/node_memory_MemTotal_bytes)* 100

磁盘
100-(node_filesystem_free_bytes{fstype=~"ext4|xfs"}/node_filesystem_size_bytes {fstype=~"ext4|xfs"}*100)
相关推荐
SRETalk6 天前
Zabbix、Prometheus、Grafana、Nightingale,四个监控如何选型?
zabbix·grafana·prometheus·nightingale
zzzzzz31014 天前
假如我是掘金管理员,我先给评论区装个'代码审查'系统
python·程序员·机器人
通信小呆呆14 天前
当算法有了“五感”:多模态数据融合如何向人体感官协同学习?
人工智能·学习·算法·机器学习·机器人
生成论实验室14 天前
机器人:一个自主运动的系统
人工智能·算法·语言模型·机器人·自动驾驶·agi·安全架构
Dick50715 天前
ROS2 常用命令表
人工智能·学习·算法·机器人
沫儿笙15 天前
川崎机器人二保焊节气设备
人工智能·机器人
C++ 老炮儿的技术栈15 天前
Qt工控实战:自研机器人TCP长连接客户端(粘包处理+心跳保活+自动重连完整源码解析)
qt·tcp/ip·机器人
Deepoch15 天前
VLA多模态架构加持 采摘机器人实现精细化智能采收
人工智能·机器人·开发板·具身模型·deepoc·采摘
选与握15 天前
$\pi_{0.7}$: 一个具备涌现能力的可引导的通用机器人基础模型
机器人·vla·pi07