我们将会介绍如何在Linux系统上安装和使用Prometheus,包括以下步骤:
- 下载和安装Prometheus
- 配置Prometheus
- 启动Prometheus服务器
- 访问Prometheus的Web界面
- 配置Prometheus监控自身
- 安装和配置Node Exporter(用于监控Linux主机)
- 配置Prometheus抓取Node Exporter
- 使用PromQL查询数据
- 集成Grafana进行数据可视化
注意:以下操作以Ubuntu系统为例,但同样适用于其他Linux发行版。
步骤1:下载和安装Prometheus
前往Prometheus官方网站下载页面(https://prometheus.io/download/)获取最新版本的Prometheus。 或者直接在服务器上使用wget下载。
假设我们使用64位的Linux系统,可以执行以下命令:
# 创建目录并进入
mkdir -p ~/prometheus-setup
cd ~/prometheus-setup
# 下载Prometheus
wget https://github.com/prometheus/prometheus/releases/download/v2.30.3/prometheus-2.30.3.linux-amd64.tar.gz
# 注意:请检查官网以获取最新版本,替换上面的版本号
# 解压
tar xvfz prometheus-*.tar.gz
# 进入解压后的目录
cd prometheus-*
步骤2:配置Prometheus
Prometheus的配置文件是prometheus.yml。默认的配置文件已经包含了监控Prometheus自身的配置。
我们可以先查看默认配置:
cat prometheus.yml
默认配置可能如下:
# 全局配置
global:
scrape_interval: 15s # 默认每15秒抓取一次
evaluation_interval: 15s # 每15秒评估一次规则
# 告警配置
alerting:
alertmanagers:
- static_configs:
- targets:
# - alertmanager:9093
# 规则文件
rule_files:
# - "first_rules.yml"
# - "second_rules.yml"
# 抓取配置
scrape_configs:
# 监控Prometheus自身
- job_name: 'prometheus'
static_configs:
- targets: ['localhost:9090']
步骤3:启动Prometheus服务器
使用以下命令启动Prometheus:
# 启动Prometheus,并指定配置文件
./prometheus --config.file=prometheus.yml
启动后,Prometheus默认会监听9090端口。
步骤4:访问Web界面
在浏览器中访问:http://<服务器的IP地址>:9090
在Web界面中,我们可以查看Prometheus的状态、执行查询等。
步骤5:配置Prometheus监控自身
默认配置中已经包含了监控自身的job,所以无需额外配置。
步骤6:安装和配置Node Exporter
Node Exporter用于暴露主机的硬件和操作系统指标。下载并安装:
# 返回上级目录
cd ~/prometheus-setup
# 下载Node Exporter
wget https://github.com/prometheus/node_exporter/releases/download/v1.2.2/node_exporter-1.2.2.linux-amd64.tar.gz
# 解压
tar xvfz node_exporter-*.tar.gz
# 进入目录
cd node_exporter-*
启动Node Exporter:
./node_exporter
Node Exporter默认监听9100端口。
步骤7:配置Prometheus抓取Node Exporter
修改Prometheus的配置文件prometheus.yml,在scrape_configs部分添加新的job:
scrape_configs:
- job_name: 'prometheus'
static_configs:
- targets: ['localhost:9090']
# 添加Node Exporter
- job_name: 'node_exporter'
static_configs:
- targets: ['localhost:9100'] # 如果Node Exporter运行在同一台机器上
重启Prometheus使配置生效(先按Ctrl+C停止,然后重新启动)。
步骤8:使用PromQL查询数据
在Web界面中,我们可以输入PromQL查询表达式。例如:
- 查看所有指标:
http_requests_total - 查看CPU使用率:
100 - (avg by (instance) (irate(node_cpu_seconds_total{mode="idle"}[5m])) * 100) - 查看内存使用:
node_memory_MemTotal_bytes - node_memory_MemFree_bytes
步骤9:集成Grafana
安装Grafana(这里以Ubuntu为例):
sudo apt-get install -y apt-transport-https
sudo apt-get install -y software-properties-common wget
wget -q -O - https://packages.grafana.com/gpg.key | sudo apt-key add -
echo "deb https://packages.grafana.com/oss/deb stable main" | sudo tee -a /etc/apt/sources.list.d/grafana.list
sudo apt-get update
sudo apt-get install grafana
启动Grafana服务:
sudo systemctl daemon-reload
sudo systemctl start grafana-server
sudo systemctl enable grafana-server
Grafana默认监听3000端口,访问http://<服务器IP>:3000,默认用户名和密码为admin/admin。
添加数据源:
登录Grafana web ui 界面,点击左边框"配置"按钮,选择"Data Source",选择"Add data source"
- 选择Prometheus
- URL填写http://localhost:9090(如果Grafana和Prometheus在同一台机器)
然后可以导入现成的仪表盘模板,例如Node Exporter的仪表盘,模板ID为1860。
这样,我们就完成了Prometheus的安装、配置,以及Node Exporter的安装和Grafana的集成。
注意:置开机启动。
下面提供将Prometheus和Node Exporter配置为系统服务的示例(Ubuntu系统):
创建Prometheus系统服务文件:
sudo nano /etc/systemd/system/prometheus.service
内容如下(请根据实际路径修改):
[Unit]
Description=Prometheus
Wants=network-online.target
After=network-online.target
[Service]
User=prometheus
Group=prometheus
Type=simple
ExecStart=/home/your_user/prometheus-setup/prometheus-2.30.3.linux-amd64/prometheus \
--config.file /home/your_user/prometheus-setup/prometheus-2.30.3.linux-amd64/prometheus.yml \
--storage.tsdb.path /home/your_user/prometheus-setup/data
[Install]
WantedBy=multi-user.target
创建Node Exporter系统服务文件:
sudo nano /etc/systemd/system/node_exporter.service
内容如下:
[Unit]
Description=Node Exporter
Wants=network-online.target
After=network-online.target
[Service]
User=prometheus
Group=prometheus
Type=simple
ExecStart=/home/your_user/prometheus-setup/node_exporter-1.2.2.linux-amd64/node_exporter
[Install]
WantedBy=multi-user.target
注意:建议创建一个专门的用户来运行这些服务:
sudo useradd --no-create-home --shell /bin/false prometheus
并修改对应目录的权限。
最后,重新加载systemd并启用服务:
sudo systemctl daemon-reload
sudo systemctl enable prometheus.service
sudo systemctl start prometheus.service
sudo systemctl enable node_exporter.service
sudo systemctl start node_exporter.service
这样,即使服务器重启,服务也会自动启动。
以上就是在Linux系统上安装和使用Prometheus的完整步骤。