Zabbix 配置钉钉告警

在企业级运维监控中,Zabbix 是一个功能强大的开源监控工具。为了实现告警信息的实时推送,将 Zabbix 与钉钉机器人集成是一种高效、便捷的方案。本文将详细介绍如何在 Zabbix 中配置钉钉告警,实现故障告警和恢复通知的自动化推送。

一、钉钉机器人配置

1. 创建钉钉群聊

首先,登录钉钉,创建一个用于接收告警信息的内部群聊。

  • 打开钉钉客户端,点击"发起群聊"。
  • 选择"内部群",添加需要接收告警的成员。
  • 设置群名称,例如:Zabbix 告警通知群

2. 添加自定义机器人

进入刚创建的群聊,点击右上角的"群设置"图标(齿轮图标),然后选择"智能群助手" → "添加机器人" → "自定义机器人"。

  • 设置机器人名称,例如:Zabbix告警机器人
  • 选择"加签"方式(推荐),并复制生成的 Webhook URL。
  • 请务必保存该 URL,后续 Zabbix 脚本中将使用它。

二、Zabbix 服务器端配置

1. 安装 Python 依赖

确保 Zabbix 服务器已安装 Python3 及 requests 模块,用于发送 HTTP 请求。

复制代码
sudo apt update                             # 更新软件包索引
sudo apt install -y python3 python3-pip     # 安装 Python3 和 pip
sudo pip3 install requests                  # 安装 requests 模块(用于发送 HTTP 请求)

2. 创建告警脚本

在 Zabbix 的脚本目录下创建钉钉告警脚本。

复制代码
sudo nano /usr/local/zabbix/share/zabbix/alertscripts/dingtalk_alert.py

将以下 Python 脚本内容写入文件:

复制代码
#!/usr/bin/env python
# -- coding: utf-8 --

import json
import requests
import sys

# 钉钉机器人Webhook地址
Dingtalkaccesstoken = "144f44aac70ffa1f0cb79d217649faa726a26596640792132e0d9d4c11630528" # 替换为你的钉钉机器人accesstoken
webhook = "https://oapi.dingtalk.com/robot/send?access_token=" + Dingtalkaccesstoken

def formatmessage(title, content):
    message_template = "{}\n{}".format(title, content)
    return message_template

def sendmsg(title, content):
    headers = {'Content-Type': 'application/json'}
    message = formatmessage(title, content)
    data = {
        "msgtype": "text",
        "text": {
            "content": message
        }
    }
    try:
        response = requests.post(webhook, headers=headers, data=json.dumps(data))
        return response.status_code
    except Exception as e:
        print("发送失败,错误信息:", e)
        return None

if __name__ == "__main__":
    if len(sys.argv) < 3:
        print("使用方法:python dingtalkalert.py '标题' '内容'")
        sys.exit(1)
    title = sys.argv[1]
    content = sys.argv[2]
    status_code = sendmsg(title, content)
    if status_code == 200:
        print("消息发送成功")
    else:
        print("消息发送失败,状态码:", status_code)

3. 设置脚本权限与属主

确保 Zabbix 服务能正常执行该脚本。

复制代码
sudo chmod +x /usr/local/zabbix/share/zabbix/alertscripts/dingtalk_alert.py   # 添加执行权限
sudo chown -R zabbix:zabbix /usr/local/zabbix/share/zabbix/alertscripts/      # 修改属主为 zabbix 用户

4. 配置 Zabbix 服务器

编辑 Zabbix 服务配置文件,确认脚本路径正确。

复制代码
sudo nano /usr/local/zabbix/etc/zabbix_server.conf

确保包含以下配置项:

复制代码
AlertScriptsPath=/usr/local/zabbix/share/zabbix/alertscripts

5. 重启 Zabbix 服务

复制代码
sudo systemctl restart zabbix-server

6. 测试脚本功能

执行脚本测试是否能成功发送消息。

复制代码
python3 /usr/local/zabbix/share/zabbix/alertscripts/dingtalk_alert.py "测试标题" "告警"

三、Zabbix Web 界面配置

1. 创建告警媒介类型

登录 Zabbix Web 界面,进入: 管理 → 报警媒介类型 → 创建媒介类型

  • 名称DingTalk alarm

  • 类型:脚本

  • 脚本名称dingtalk_alert.py

  • 脚本参数

    {ALERT.SUBJECT}
    {ALERT.MESSAGE}
    {ALERT.SENDTO}

2. 为用户添加告警媒介

进入: 管理 → 用户 → 选择用户(如 Admin)→ 报警媒介 → 添加

  • 类型:DingTalk alarm
  • 收件人 :可填写 zabbix@company.com 或任意标识
  • 启用:勾选

3. 创建告警动作

进入: 配置 → 动作 → 触发器动作 → 创建动作

基本信息
  • 名称Send Alert to DingTalk
操作(告警时)
  • 操作:添加
  • 仅送到 :选择 DingTalk alarm

主题:

复制代码
🚨 故障告警:{HOSTNAME1} 发生 {TRIGGER.NAME}

消息:

复制代码
🔴 告警主机: {HOSTNAME1}
   主机地址: {HOST.IP}
   告警等级: {TRIGGER.SEVERITY}
   监控项目: {TRIGGER.KEY1}
   问题详情: {ITEM.NAME} = {ITEM.VALUE}
   当前状态: {TRIGGER.STATUS}
   告警信息: {TRIGGER.NAME}
   告警时间: {EVENT.DATE} {EVENT.TIME}
   事件ID: {EVENT.ID}
恢复操作
  • 添加
  • 仅送到:DingTalk alarm

主题:

复制代码
✅ 恢复通知:{HOSTNAME1} 的 {TRIGGER.NAME} 已恢复

消息:

复制代码
🟢 恢复主机: {HOSTNAME1}
   主机地址: {HOST.IP}
   告警等级: {TRIGGER.SEVERITY}
   监控项目: {TRIGGER.KEY1}
   问题详情: {ITEM.NAME} = {ITEM.VALUE}(已恢复正常)
   当前状态: {TRIGGER.STATUS}
   告警信息: {TRIGGER.NAME}(已恢复)
   恢复时间: {EVENT.DATE} {EVENT.TIME}
   事件ID: {EVENT.ID}

四、测试与验证

  1. 手动触发一个监控项告警(如停止 nginx 服务)。
  2. 查看钉钉群是否收到告警消息。
  3. 恢复服务,确认是否收到恢复通知。

五、常见问题排查

问题 可能原因 解决方案
消息未发送 脚本无执行权限 使用 chmod +x 添加权限
发送失败 access_token 错误 检查 Webhook URL 是否正确
Zabbix 找不到脚本 路径配置错误 确认 AlertScriptsPath 正确
机器人被禁用 频繁发送或违规 检查钉钉机器人状态

本文基于 Ubuntu 系统,完整演示了 Zabbix 与钉钉机器人的集成流程。通过脚本化告警推送,实现了监控告警的即时触达,极大提升了运维响应效率。建议结合加签机制、消息模板优化和定期测试,确保告警系统的稳定可靠。

相关推荐
C_心欲无痕7 小时前
ts - tsconfig.json配置讲解
linux·前端·ubuntu·typescript·json
HIT_Weston8 小时前
93、【Ubuntu】【Hugo】搭建私人博客:面包屑(一)
linux·运维·ubuntu
HIT_Weston8 小时前
92、【Ubuntu】【Hugo】搭建私人博客:侧边导航栏(六)
linux·运维·ubuntu
CodeAllen嵌入式8 小时前
Windows 11 本地安装 WSL 支持 Ubuntu 24.04 完整指南
linux·运维·ubuntu
老前端的功夫13 小时前
TypeScript 类型魔术:模板字面量类型的深层解密与工程实践
前端·javascript·ubuntu·架构·typescript·前端框架
HABuo13 小时前
【Linux进程(四)】进程切换&环境变量深入剖析
linux·运维·服务器·c语言·c++·ubuntu·centos
罗马苏丹默罕默德20 小时前
Ubuntu下部署.NetCore WebApi的方法
数据库·ubuntu·.netcore
一尘之中20 小时前
在Ubuntu 22.04中高效使用pip:从入门到精通
ubuntu·pip·ai写作
一尘之中21 小时前
Ubuntu 22.04 SSH服务完全配置指南:从基础到安全加固
ubuntu·ssh·ai写作
老兵发新帖21 小时前
ubuntu服务器配置私钥登录
linux·服务器·ubuntu