性能监控-grafana+prometheus+node_exporter

Prometheus是一个开源的系统监控和报警工具。它由SoundCloud开发并于2012年发布,后来成为了一个独立的开源项目,并得到了广泛的应用和支持。

Prometheus的主要功能包括采集和存储各种系统和应用程序的监控数据,并提供强大的查询语言PromQL来分析和查询数据。它支持多种数据采集方式,包括主动式推送和被动式拉取。同时,Prometheus还提供了灵活的可视化和报警功能,用于监控系统的性能、负载、可用性等指标,并及时发出警报以便及时处理问题。

Prometheus以其可靠性、可扩展性和易于使用而受到广泛的欢迎和应用,被许多云原生应用和容器化环境所采用。它与其他工具和系统的集成也很方便,例如Grafana用于数据可视化、Alertmanager用于报警管理等。总的来说,Prometheus是一个功能强大的监控工具,适用于各种规模和类型的系统和应用。

下载prometheus

Download | Prometheus

Download | Prometheus

下载prometheus,解压,运行

./prometheus

并访问http://localhost:9090/进入主页

node_exporter

Node Exporter 是一个用于 Prometheus 监控系统的开源项目,用于收集和暴露有关主机操作系统(如 CPU、内存、磁盘、网络等)的相关指标。

Node Exporter 通过运行在受监控主机上的一个独立进程来收集系统资源使用情况。它会访问操作系统的各种接口和文件系统,如 `/proc`、`/sys`、`/procfs` 等,从中收集有关主机的性能指标。

一些 Node Exporter 支持的指标包括:

  1. CPU 相关指标:包括 CPU 负载、各个 CPU 核心的使用率、中断次数等。

  2. 内存相关指标:包括总内存、可用内存、内存使用率、缓存和缓冲区使用量等。

  3. 磁盘相关指标:包括磁盘空间使用率、磁盘 I/O、磁盘队列长度等。

  4. 网络相关指标:包括网络流量、连接数、网络错误等。

  5. 系统负载和 Uptime 相关指标:包括系统平均负载、开机时间等。

Node Exporter 提供了一个 HTTP 接口,通过该接口可以将收集到的指标以 Prometheus 格式的样式暴露出来,从而使 Prometheus 可以定期抓取和存储这些指标,并进行进一步的分析和可视化。

在实际使用中,通常需要在要监控的主机上部署 Node Exporter,并在 Prometheus 配置文件中添加相应的 job 来监控该主机。这样,Prometheus 就可以通过 Node Exporter 收集并存储主机的指标数据,以供后续查询和监控使用。

服务器安装node_exporter

Exporter是Prometheus的指标数据收集组件。它负责从目标Jobs收集数据,并把收集到的数据转换为Prometheus支持的时序数据格式。 和传统的指标数据收集组件不同的是,他只负责收集,并不向Server端发送数据,而是等待Prometheus Server 主动抓取,node-exporter 默认的抓取url地址:http://ip:9100/metrics

文档:使用节点导出器监控 Linux 主机指标 |普罗 米修斯 (prometheus.io)

在需要监控的服务器上安装node_exporter

GitHub - prometheus/node_exporter: Exporter for machine metrics

Release 1.6.1 / 2023-06-17 · prometheus/node_exporter (github.com)

wget 对应版本的地址

tar xvfz node_exporter-*.*-amd64.tar.gz

cd node_exporter-*.*-amd64

chmod 777 node_exporter

./node_exporter

后台启动

要在Linux系统中以后台方式运行`./node_exporter`,你可以使用以下命令:

nohup ./node_exporter &

在这个命令中,`nohup` 表示忽略掉挂起信号,`&` 表示在后台运行命令。

这样做后,`./node_exporter` 将在后台一直运行,即使你退出当前的终端或者关闭SSH连接,它也会继续运行。你可以通过查看日志文件或进程查看程序的运行状态。

配置Prometheus

1、记事本打开prometheus.yml文件,增加配置

  • job_name: 'linux-exporter'

metrics_path: /metrics

static_configs:

targets: ['服务器IP:9100']

重新启动prometheus.exe,访问http://localhost:9090/targets

观察对应服务器State状态为UP即为配置成功。

我这里端口没开,所以状态不对。

点进端点显示,metrics就是记录的服务器数据。

expression browser

在graph输入表达式,点击Execute可以看到结果

Prometheus 提供了一种名为 PromQL (Prometheus Query ) 的函数式查询语言 语言),允许用户实际选择和聚合时间序列数据 时间。表达式的结果可以显示为图形,查看为 普罗米修斯表达式浏览器中的表格数据,或外部使用的表格数据 系统通过 HTTP API

查询基础知识 |普罗 米修斯 (prometheus.io)

配置grafana并添加数据源

Grafana | Prometheus

1、进入grafana左侧工具栏点击Data Sources添加数据源

导入模板

模板资源:Dashboards | Grafana Labs

Grafana | Prometheus

模板ID号:12633,选择prometheus数据源。

因项目经常变更服务器,采用grafana及Prometheus本地安装。更换服务器只需在服务器安装node_exporter并配置Prometheus.yml即可实现对服务器的监控。

但是导入模板后,这里并没有显示数据。--后来发现是自己把prometheus里端口写错了,应该写node_Exporter的9100,写成了9090。

修改后数据可以看到了。

相关推荐
被一米六支配的恐惧4 小时前
使用prometheus-operator部署prometheus服务,并对外提供访问
prometheus
HappRobot1 天前
Prometheus架构组件
prometheus
云原生的爱好者1 天前
Prometheus+Grafana+K8s构建监控告警系统
kubernetes·grafana·prometheus
INFINI Labs2 天前
如何使用 Grafana 连接 Easyearch
grafana·easysearch
dmonstererer2 天前
【grafana原生告警中心配置飞书机器人告警】
机器人·飞书·grafana
奈斯ing3 天前
【prometheus+Grafana篇】Prometheus与Grafana:深入了解监控架构与数据可视化分析平台
信息可视化·grafana·prometheus
东风微鸣4 天前
关于全球化大规模混合云 Kubernetes Prometheus 监控体系标准化及 GitOps 自动化改进方案
kubernetes·自动化·prometheus
迷茫运维路4 天前
K8S+Prometheus+Consul+alertWebhook实现全链路服务自动发现与监控、告警配置实战
运维·kubernetes·go·prometheus·consul
被一米六支配的恐惧6 天前
k8s部署grafana
容器·kubernetes·grafana