使用 Grafana 展示多个TiDB集群的告警

作者: yangzhj 原文来源: https://tidb.net/blog/229e283c

背景

在日常运维工作中,我们有时需要将多个生产集群的告警信息展示在一起,统一集中观察和分析TiDB 集群的告警情况。

本文将通过 Grafana 的多数据源功能来将多个TiDB 集群的 emergency级别的告警信息展示到一张 Grafana Dashboard 中。

实现过程示例

首先需要选择某个集群的 grafana 创建 Dashboard。

创建dashboard

创建panel

配置panel

添加其他tidb集群的数据源

在面板中增加其他数据源的监控指标

添加其他监控指标的面板

其他监控指标面板的方式与上述示例相同,不再重复描述。

示例Dashboard配置

JSON 复制代码
{
  "annotations": {
    "list": [
      {
        "builtIn": 1,
        "datasource": "-- Grafana --",
        "enable": true,
        "hide": true,
        "iconColor": "rgba(0, 211, 255, 1)",
        "name": "Annotations & Alerts",
        "type": "dashboard"
      }
    ]
  },
  "editable": true,
  "gnetId": null,
  "graphTooltip": 0,
  "id": 27,
  "links": [],
  "panels": [
    {
      "datasource": "-- Mixed --",
      "description": "",
      "fieldConfig": {
        "defaults": {
          "color": {
            "mode": "palette-classic"
          },
          "custom": {
            "axisLabel": "",
            "axisPlacement": "auto",
            "barAlignment": 0,
            "drawStyle": "line",
            "fillOpacity": 10,
            "gradientMode": "none",
            "hideFrom": {
              "graph": false,
              "legend": false,
              "tooltip": false
            },
            "lineInterpolation": "stepAfter",
            "lineStyle": {
              "fill": "solid"
            },
            "lineWidth": 1,
            "pointSize": 4,
            "scaleDistribution": {
              "type": "linear"
            },
            "showPoints": "always",
            "spanNulls": true
          },
          "mappings": [
            {
              "from": "",
              "id": 1,
              "text": "告警中",
              "to": "",
              "type": 1,
              "value": "1"
            }
          ],
          "max": 1,
          "min": 0,
          "thresholds": {
            "mode": "absolute",
            "steps": [
              {
                "color": "green",
                "value": null
              },
              {
                "color": "red",
                "value": 80
              }
            ]
          },
          "unit": "short"
        },
        "overrides": []
      },
      "gridPos": {
        "h": 6,
        "w": 12,
        "x": 0,
        "y": 0
      },
      "id": 2,
      "options": {
        "graph": {},
        "legend": {
          "calcs": [
            "lastNotNull"
          ],
          "displayMode": "table",
          "placement": "right"
        },
        "tooltipOptions": {
          "mode": "multi"
        }
      },
      "pluginVersion": "7.5.11",
      "targets": [
        {
          "datasource": "test657",
          "exemplar": false,
          "expr": "ALERTS{alertname=\"TiDB_server_is_down\"}",
          "instant": false,
          "interval": "",
          "legendFormat": "test657-{{alertstate}}",
          "queryType": "randomWalk",
          "refId": "A"
        },
        {
          "datasource": "onemirror657",
          "exemplar": true,
          "expr": "ALERTS{alertname=\"TiDB_server_is_down\"}",
          "format": "time_series",
          "hide": false,
          "instant": false,
          "interval": "",
          "legendFormat": "onemirror657-{{alertstate}}",
          "refId": "B"
        }
      ],
      "timeFrom": null,
      "timeShift": null,
      "title": "TiDB_server_is_down",
      "type": "timeseries"
    }
  ],
  "refresh": false,
  "schemaVersion": 27,
  "style": "dark",
  "tags": [],
  "templating": {
    "list": []
  },
  "time": {
    "from": "now-3h",
    "to": "now"
  },
  "timepicker": {},
  "timezone": "",
  "title": "New dashboard Copy",
  "uid": "RPbLfznHk",
  "version": 5
}

询问AI

相关推荐
是程序喵呀3 分钟前
部署GitLab服务器
运维·服务器·gitlab
●VON4 分钟前
go语言的成神之路-标准库篇-os标准库
linux·运维·服务器·开发语言·后端·学习·golang
TracyGC11 分钟前
ubuntu 新建脚本shell并增加图标 双击应用实现python运行
linux·运维·ubuntu
怡雪~12 分钟前
k8s的Pod亲和性
linux·容器·kubernetes
清风 00113 分钟前
一、使用 mdadm 工具在 Ubuntu 上创建 RAID 1(镜像)
运维·服务器·数据库
白白白白白kkk14 分钟前
【Ubuntu】脚本自动化控制终端填充
linux·ubuntu·自动化
星河梦瑾19 分钟前
【2025最新版】搭建个人博客教程
linux·经验分享·笔记·python·安全
道斯22 分钟前
asp.net老项目运维,出现的问题6之数据库
数据库
zxrhhm22 分钟前
Oracle PL/SQL编程中批量数据处理Sparse Collections and SQL%BULK_EXCEPTIONS
数据库·oracle
LCL_1842 分钟前
ansible 自动化运维工具(三)playbook剧本
linux·运维·自动化·ansible