Prometheus与Grafana入门:从安装到基础监控的完整指南

Prometheus与Grafana入门:从安装到基础监控的完整指南

Prometheus 和 Grafana 是现代监控系统的黄金组合。Prometheus 作为一个开源的监控系统和时间序列数据库,以其强大的指标收集和查询能力广泛应用于云原生环境。而 Grafana 则是一个用于数据可视化和监控的开源平台,能够将 Prometheus 收集的数据以图表的形式展现出来,帮助用户更直观地理解系统的运行状态。本指南将从 Prometheus 和 Grafana 的安装开始,逐步讲解如何配置基本的监控任务。


一、Prometheus 简介

Prometheus 是一个开源系统监控和报警工具包,最初由 SoundCloud 开发,并且现已成为 Cloud Native Computing Foundation 的一个项目。Prometheus 专注于多维度的数据模型,灵活的查询语言(PromQL)和强大的数据收集、告警功能,使其在微服务和容器化应用监控中尤为流行。

Prometheus 主要特点
  1. 多维度数据模型:基于时间序列数据,标记数据由 metric 名称和键值对(labels)标识。
  2. PromQL 查询语言:用于实时查询和聚合数据。
  3. 无依赖架构:依赖拉模式(pull model)主动收集目标端点的 metrics 数据。
  4. 支持多种数据导出:支持多种 exporter 以便从不同的服务中收集数据。
  5. 内置时序数据库:独立运行,无需外部时序数据库依赖。

二、Grafana 简介

Grafana 是一个开源的、功能强大的可视化和监控平台。它允许用户连接多种数据源(如 Prometheus、Graphite、Elasticsearch 等),并使用丰富的图表、警报和面板进行数据展示。Grafana 的灵活性和易用性使其成为很多团队监控、分析、并告警的首选工具。

Grafana 主要特点
  1. 多数据源支持:支持多种数据源的集成和统一管理。
  2. 强大的可视化能力:多种图表类型支持(折线图、柱状图、热力图等)。
  3. 灵活的仪表盘管理:支持自定义仪表盘和面板。
  4. 丰富的插件生态:可以通过插件扩展数据源和图表类型。
  5. 告警功能:支持基于监控数据的阈值报警和通知。

三、Prometheus 与 Grafana 的安装

接下来我们将详细讲解如何在本地环境中安装 Prometheus 和 Grafana,并进行基础的配置。

1. Prometheus 的安装

步骤 1:下载 Prometheus

首先,从 Prometheus 官方下载页面 获取最新版本的 Prometheus。根据操作系统选择相应的版本并下载。

bash 复制代码
wget https://github.com/prometheus/prometheus/releases/download/v2.39.1/prometheus-2.39.1.linux-amd64.tar.gz
tar -xvzf prometheus-2.39.1.linux-amd64.tar.gz
cd prometheus-2.39.1.linux-amd64

步骤 2:配置 Prometheus

Prometheus 的配置文件通常命名为 prometheus.yml,用于定义需要监控的目标和其他相关配置。以下是一个基本的配置示例:

yaml 复制代码
global:
  scrape_interval: 15s  # 默认抓取间隔

scrape_configs:
  - job_name: 'prometheus'
    static_configs:
      - targets: ['localhost:9090']

这个配置定义了一个名为 prometheus 的 job,Prometheus 将每隔 15 秒从 localhost:9090 抓取数据。

步骤 3:启动 Prometheus

使用以下命令启动 Prometheus:

bash 复制代码
./prometheus --config.file=prometheus.yml

启动后,Prometheus 将默认运行在 localhost:9090

2. Grafana 的安装

步骤 1:下载 Grafana

Grafana 官方下载页面 获取最新版本的 Grafana,并根据操作系统进行安装。

例如,在 Ubuntu 上可以使用如下命令安装:

bash 复制代码
sudo apt-get install -y adduser libfontconfig1
wget https://dl.grafana.com/enterprise/release/grafana-enterprise_9.4.3_amd64.deb
sudo dpkg -i grafana-enterprise_9.4.3_amd64.deb

步骤 2:启动 Grafana

安装完成后,启动 Grafana 服务:

bash 复制代码
sudo systemctl start grafana-server
sudo systemctl enable grafana-server

Grafana 默认运行在 localhost:3000,初始用户名和密码都是 admin


四、Prometheus 和 Grafana 的集成

有了 Prometheus 和 Grafana 之后,我们需要将 Prometheus 作为数据源接入 Grafana 以实现数据可视化。

1. 配置 Grafana 数据源
  1. 登录 Grafana,进入仪表盘后选择"配置(齿轮图标)" > "数据源"。
  2. 点击"添加数据源",选择 Prometheus 作为数据源。
  3. 在 URL 中输入 Prometheus 的地址(例如 http://localhost:9090),然后点击"保存和测试"。

成功配置后,Grafana 就可以从 Prometheus 获取数据进行展示。

2. 创建 Grafana 仪表盘
  1. 进入 Grafana 首页,点击左侧菜单的"创建" > "仪表盘"。

  2. 在新仪表盘页面,点击"添加新面板"。

  3. 选择 Prometheus 数据源,并在查询窗口中输入 PromQL 查询。例如,查询 CPU 使用率可以输入:

    promql 复制代码
    rate(node_cpu_seconds_total{mode="idle"}[5m])
  4. 配置完成后,点击"应用"保存面板。

通过这种方式,可以逐步搭建符合自己需求的监控面板,展示系统的各项指标。


五、基础监控任务

Prometheus 和 Grafana 结合使用时,可以轻松实现多种监控任务。以下是一些常见的基础监控示例:

1. CPU 使用率监控

监控 CPU 使用率是服务器监控的基础任务之一。通过以下 PromQL 查询语句,可以获得 CPU 使用率的相关数据:

promql 复制代码
100 - (avg by(instance) (irate(node_cpu_seconds_total{mode="idle"}[5m])) * 100)
2. 内存使用情况监控

内存使用情况的监控同样非常重要,可以通过以下 PromQL 查询内存的使用率:

promql 复制代码
100 * (1 - (node_memory_MemAvailable_bytes / node_memory_MemTotal_bytes))
3. 磁盘 I/O 监控

磁盘 I/O 反映了磁盘的读写情况,通过监控这些指标,可以预防由于 I/O 瓶颈引发的性能问题。

promql 复制代码
rate(node_disk_read_bytes_total[5m])

和:

promql 复制代码
rate(node_disk_written_bytes_total[5m])
4. 网络流量监控

通过以下 PromQL 语句,可以监控网络的入站和出站流量:

promql 复制代码
rate(node_network_receive_bytes_total[5m])

和:

promql 复制代码
rate(node_network_transmit_bytes_total[5m])

六、告警设置

Prometheus 和 Grafana 不仅支持数据的收集和展示,还能够根据设定的规则发送告警。告警功能可以帮助管理员及时发现系统问题并采取措施。

1. Prometheus 告警规则配置

在 Prometheus 中,可以通过 alerting.rules 文件定义告警规则。例如,设置一个当 CPU 使用率超过 80% 时触发告警:

yaml 复制代码
groups:
- name: example
  rules:
  - alert: HighCPUUsage
    expr: 100 - (avg by(instance) (irate(node_cpu_seconds_total{mode="idle"}[5m])) * 100) > 80
    for: 5m
    labels:
      severity: warning
    annotations:
      summary: "High CPU usage detected"
2. Grafana 告警配置

在 Grafana 中可以基于面板设置告警规则:

  1. 选择一个需要告警的图表,进入"编辑"模式。
  2. 点击"报警"标签,选择"创建告警规则"。
  3. 设置告警条件、通知渠道(例如 Email、Slack)等,并保存。

七、总结

Prometheus 和 Grafana 是现代系统监控领域的强大工具组合。Prometheus 负责数据收集、存储和告警,而 Grafana 则专注于数据的可视化展示。通过本指南的详细步骤,你可以从零开始搭建一个基本的监控系统,帮助你更好地了解

和管理应用系统的性能和健康状态。

在使用过程中,可以进一步探索 Prometheus 的高级功能,如自定义导出器、复杂的 PromQL 查询等,以及 Grafana 丰富的插件和自定义报警配置,以更好地满足具体的监控需求。通过不断地优化和调整监控策略,你的系统将会变得更加健壮、可控。

相关推荐
晴天飛 雪11 小时前
Grafana监控PostgreSQL
数据库·postgresql·grafana
大虾别跑1 天前
docker安装zabbix +grafana
docker·zabbix·grafana
菜鸟挣扎史1 天前
grafana+prometheus+windows_exporter实现windows进程资源占用的监控
windows·grafana·prometheus·进程·process
tester Jeffky2 天前
JMeter监听器与压测监控之Grafana
jmeter·eureka·grafana
牙牙7053 天前
Prometheus结合K8s(二)使用
容器·kubernetes·prometheus
牙牙7054 天前
Prometheus结合K8s(一)搭建
容器·kubernetes·prometheus
福大大架构师每日一题4 天前
32.2 prometheus倒排索引统计功能
ios·iphone·prometheus
DB菜鸟5 天前
Grafana Username password invalid
java·服务器·grafana
让生命变得有价值5 天前
使用 Grafana api 查询 Datasource 数据
grafana·prometheus
福大大架构师每日一题5 天前
31.3 XOR压缩和相关的prometheus源码解读
prometheus