在 OpenStack Rocky 中部署 Prometheus + Grafana

一、环境说明

1. 基础环境

  • OpenStack 版本:Rocky
  • 部署模式:All-in-One
    • 控制节点 + 计算节点在同一台虚拟机
  • 操作系统:CentOS Linux 7.9.2009
  • 虚拟化:KVM + libvirt
  • 网络:宿主机可访问 OpenStack 虚拟机管理网段

2. 目标

  • 使用 Prometheus 采集监控指标
  • 使用 Grafana 进行可视化
  • 监控内容包括:
    • 宿主机(CPU / 内存 / 磁盘)
    • OpenStack 虚拟机实例(CPU / 内存 / 网络)
  • 为后续 实例能耗估算 做数据准备

二、整体架构

复制代码
+--------------------------------------------------+
| OpenStack Rocky All-in-One (CentOS 7.9)          |
|                                                  |
|  +----------------+     +--------------------+  |
|  | node_exporter  | --> |                    |  |
|  | (9100)         |     |                    |  |
|  +----------------+     |                    |  |
|                          |   Prometheus       |  |
|  +----------------+     |   (9090)            |  |
|  | libvirt_exporter| --> |                    |  |
|  | (9177)         |     |                    |  |
|  +----------------+     +--------------------+  |
|                                                  |
|                     +--------------------+       |
|                     | Grafana (3000)     |       |
|                     +--------------------+       |
+--------------------------------------------------+

三、部署 node_exporter(宿主机监控)

1. 下载与解压

shell 复制代码
cd /opt
wget https://github.com/prometheus/node_exporter/releases/download/v1.7.0/node_exporter-1.7.0.linux-amd64.tar.gz
tar xf node_exporter-1.7.0.linux-amd64.tar.gz
ln -s node_exporter-1.7.0.linux-amd64 node_exporter

2. 启动

shell 复制代码
cd /opt/node_exporter
./node_exporter &

3. 验证

复制代码
ss -lntp | grep 9100
curl http://localhost:9100/metrics | head

确认 9100 端口监听成功。


四、部署 libvirt_exporter(实例级监控)

1. 前置依赖(非常关键)

shell 复制代码
yum install -y libvirt-devel libvirt-daemon-devel pkgconfig gcc

2. 编译 libvirt_exporter

shell 复制代码
cd /opt
git clone https://github.com/Tinkoff/libvirt-exporter.git
cd libvirt-exporter
go build -o libvirt-exporter

3. 启动 exporter

shell 复制代码
./libvirt-exporter --libvirt.uri="qemu:///system" &

4. 验证实例指标

shell 复制代码
curl http://localhost:9177/metrics | grep instance

应能看到类似:

shell 复制代码
libvirt_domain_info_cpu_time_seconds_total{domain="instance-0000xxxx"} ...

五、部署 Prometheus

1. 安装

shell 复制代码
cd /opt
wget https://github.com/prometheus/prometheus/releases/download/v2.48.0/prometheus-2.48.0.linux-amd64.tar.gz
tar xf prometheus-2.48.0.linux-amd64.tar.gz
ln -s prometheus-2.48.0.linux-amd64 prometheus

2. 配置文件 /opt/prometheus/prometheus.yml

shell 复制代码
global:
  scrape_interval: 15s

scrape_configs:
  - job_name: "node-exporter"
    static_configs:
      - targets: ["localhost:9100"]

  - job_name: "libvirt"
    static_configs:
      - targets: ["localhost:9177"]

3. 启动 Prometheus

shell 复制代码
/opt/prometheus/prometheus \
  --config.file=/opt/prometheus/prometheus.yml &

六、部署 Grafana

1. 安装

shell 复制代码
yum install -y https://dl.grafana.com/oss/release/grafana-10.2.3-1.x86_64.rpm
systemctl enable grafana-server
systemctl start grafana-server

2. 访问

shell 复制代码
http://<OpenStack_IP>:3000

默认账号:

shell 复制代码
admin / admin

3. 添加 Prometheus 数据源

  • URL:http://localhost:9090
  • Save & Test → Success

七、Dashboard 使用说明

1. Node Exporter Full(宿主机)

  • Dashboard ID:1860
  • 注意事项:
    • Prometheus 中的 job 名称需为 node-exporter
    • 导入后必须选择:
      • Job
      • Instance
      • Nodename
  • 常见问题:
    • No data ≠ 没采集数据
    • 多数是变量未选择或 job 名不匹配

2. libvirt 实例监控

公共 Dashboard 在 libvirt 场景下假设差异较大,

最终采用 自定义 Dashboard,直接基于以下指标:

  • libvirt_domain_info_cpu_time_seconds_total
  • libvirt_domain_memory_stats_used_percent
  • libvirt_domain_interface_stats_*

确保:

  • 不依赖固定 job 名
  • 直接按 domain 标签区分实例
相关推荐
成为你的宁宁6 小时前
【K8S黑盒监控实践:Probe配置、Prometheus验证与Grafana可视化】
kubernetes·grafana·prometheus
成为你的宁宁6 小时前
【Prometheus Operator监控K8S Nginx】
nginx·kubernetes·prometheus
人生匆匆7 小时前
部署cadvisor+prometheus+grafana
grafana·prometheus
成为你的宁宁8 小时前
【K8S使用Helm部署MySQL一主多从并集成Prometheus监控】
mysql·kubernetes·prometheus
SuperArc19991 天前
Grafana相关数据可视化平台基础教程-序言
运维·信息可视化·数据分析·grafana
小黑蛋学java2 天前
Nginx 接口耗时 Prometheus + Grafana 监控实施方案
运维·nginx·负载均衡·grafana·prometheus
Adorable老犀牛2 天前
nginx_exporter:Prometheus 监控 Nginx 基础指标
运维·nginx·prometheus
成为你的宁宁2 天前
【基于 Prometheus Operator 实现 K8s 环境下 Redis Cluster 集群监控部署】
redis·kubernetes·prometheus
成为你的宁宁3 天前
【Prometheus Operator 监控 K8S集群的Calico 与 Ingress-Nginx 组件】
kubernetes·prometheus