在现代软件开发和运维领域,容器化技术的应用越来越广泛,其中 Docker 作为最受欢迎的容器化解决方案之一,其容器的监控管理变得至关重要。本文将详细介绍如何使用 cadvisor、Prometheus 和 Grafana 来监控 Docker 容器的状态。
一、安装镜像
我们需要安装几个关键的镜像,这些镜像将帮助我们收集、存储和可视化容器及主机的相关数据。通常,我们会将 cadvisor 和 node - exporter 安装在被监控的主机上,而将 Prometheus 和 Grafana 安装在监控服务器上,不过它们也可以安装在同一台服务器上。
以下是具体的安装命令:
docker pull gcr.io/cadvisor/cadvisor:v0.49.1 # 收集并展示容器的资源使用和性能数据
docker pull prom/prometheus # 基于拉取模型收集指标数据,可以设置报警规则
docker pull grafana/grafana # 监控数据可视化
docker pull quay.io/prometheus/node-exporter # 收集主机级别的系统指标
二、添加配置文件
在主机的根目录下,我们需要添加一个 prometheus.yml
文件,并进行如下配置:
global:
scrape_interval: 15s
evaluation_interval: 15s
scrape_timeout: 10s
alerting:
alertmanagers:
- static_configs:
- targets: ["alertmanager:9093"]
rule_files:
- "rules/*.rules"
scrape_configs:
- job_name: "prometheus"
static_configs:
- targets: ["localhost:9090"]
labels:
app: "prometheus"
environment: "production"
- job_name: "docker" # 监控的docker容器
static_configs:
- targets: ["监控服务器IP地址或域名:8080"]
labels:
instance: "docker-host"
environment: "production"
- job_name: "linux" # 监控的服务器主机
static_configs:
- targets: ["监控服务器IP地址或域名:9100"]
labels:
instance: "server-01"
environment: "production"
这些配置项定义了 Prometheus 的全局设置、报警管理、规则文件以及要监控的目标。
三、Compose.yaml 文件编写
通过 docker-compose
来管理多个容器是一种非常便捷的方式。以下是 compose.yaml
文件的内容:
services:
prometheus:
container_name: prometheus
image: prom/prometheus
restart: unless-stopped
networks:
- 网络名称
volumes:
- /etc/prometheus.yml:/etc/prometheus/prometheus.yml
- prometheus_data:/prometheus
ports:
- "9090:9090"
cadvisor:
container_name: cadvisor
image: gcr.io/cadvisor/cadvisor:v0.49.1
restart: unless-stopped
privileged: true
volumes:
- "/:/rootfs:ro"
- "/var/run:/var/run:ro"
- "/sys:/sys:ro"
- "/var/lib/docker:/var/lib/docker:ro"
- "/dev/disk:/dev/disk:ro"
ports:
- "8080:8080"
grafana:
container_name: grafana
image: grafana/grafana
restart: unless-stopped
networks:
- 网络名称
volumes:
- grafana_data:/var/lib/grafana
ports:
- "3000:3000"
node_exporter:
container_name: node_exporter
image: quay.io/prometheus/node-exporter:latest
ports:
- "9100:9100"
command:
- '--path.rootfs=/host'
network_mode: host
pid: host
restart: unless-stopped
volumes:
- '/:/host:ro,rslave'
networks:
网络名称:
volumes:
prometheus_data:
grafana_data:
这个文件定义了各个服务的容器配置,包括镜像、重启策略、挂载卷、端口映射等。
四、Grafana 配置
(1)数据源配置
启动 Grafana 后,我们需要添加 Prometheus 作为数据源。在 Grafana 的界面中,按照提示添加 Prometheus 数据源,这将让 Grafana 能够从 Prometheus 中获取监控数据。

(2)仪表板配置
为了更直观地展示监控数据,我们可以在 Grafana 中导入预设的仪表板。在仪表板导入界面,输入仪表板 ID 193 和 9276。其中,193 是 Docker 容器监控模板,9276 是 Linux 主机监控模板。导入后,我们就可以清晰地看到 Docker 容器和 Linux 主机的各项监控指标。

通过以上步骤,我们就完成了 Docker 容器状态的监控系统搭建。利用 cadvisor 收集容器数据,Prometheus 存储和管理数据,Grafana 进行数据可视化,我们可以及时发现容器运行中的问题,保障系统的稳定运行。

