前言
之前我们已经尝试了在 prometheus 上创建警报,并且使用 alertmanager 来发送通知了: 基于 Prometheus+Alertmanager+Grafana 打造监控报警后台(二)-Alertmanager部署与告警路由配置 - 使用 alertmanager 发送警报。
但是正常情况下,我们都是在 grafana 后台查看我们所创建的 dashboard 仪表盘。 同时 grafana 后台也可以显示我们在 prometheus 上创建的规则 (包含警报规则和记录规则)。今天我们在grafana上创建告警规则,使用grafana来进行告警通知。
一、创建联络点
在创建告警前需要配置邮件 smtp 服务
(基于 Prometheus+Alertmanager+Grafana 打造监控报警后台(三)-Grafana安装及介绍)/opt/grafana/config/grafana.ini

创建消息通知模版
模版内容:
yaml
{{ define "server.offline.info" }}
{{ range .Alerts }}
> 告警名称:{{ index .Labels "alertname" }}
> 服务器IP: {{.Annotations.summary}}
> 触发时间:{{ index .StartsAt }}
> 采集任务:node_exporter
{{ end -}}
当前该服务器无法访问,`node_exporter` 指标中断。请立即检查网络、电源或主机状态!
{{ end }}
{{ template "server.offline.info" . }}
创建联络点
填写名称、选择通知方式、填写模版(以邮箱和企业微信为例)
二、创建报警规则
Pending period可设置报警时间,多长时间没有恢复是触发告警,防止误报

创建标签,这个标签非常重要需要在后期的通知策略中使用与联络人进行关联


设置消息体:模版中使用
三、设置通知策略

labels就是刚刚在创建规则时填写的标签
contact point是刚刚在联络点创建的通知
这样报警和通知就联系起来了。
