动动手指,Prometheus 部署流程收入囊中

👈👈👈 欢迎点赞收藏关注哟

首先分享之前的所有文章 >>>> 😜😜😜
文章合集 : 🎁 juejin.cn/post/694164...
Github : 👉 github.com/black-ant
CASE 备份 : 👉 gitee.com/antblack/ca...

一. 前言

秒杀系列已经准备开始聊应用了,但是前置模块还有监控体系未完善。

一个系统的监控我通常认为有3个层次

  • API 监控 : 主要用于监控接口耗时和接口错误率等信息
  • 硬件监控 : 包括 CPU ,内存等基础资源的监控
  • 应用监控 : 主要对JVM ,连接池,容器信息进行监控

这一篇目标是基于 Prometheus 和 K8S 搭建一套监控系统,当然资金充裕可以跳过,直接使用云服务商完善的体系即可,好用又扎实。

后续的秒杀必须使用到监控,不监控不知道性能情况,这一篇就来学习下,怎么部署系统监控。

二. 宏观

2.1 宏观概念

Prometheus 能做什么 ?

  • S1 : 定期收集来自各种数据源的度量标准数据 ,包括应用系统性能,资源占用等
  • S2 : 按照时间序列将数据存储到数据库中
  • S3 : 通过特定的查询语句(PromQL)实时查询数据数据

  • 支持可视化的展示,生成看板,和 Grafana 结合使用
  • 支持自定义报警功能,基于报警规则生成报警
  • 支持动态发现目标,自动进行监控
  • 支持监控多个数据源,同时监控多个系统

功能一览

流程是什么 ?

  • S1 : Prometheus 提供了大量的 Exporter 用于将各种系统,和服务中的度量收集,首先需要安装对应系统的 exporter
  • S2 : 安装 Prometheus 组件 ,由 Prometheus 收集相关组件的数据
  • S3 : 安装 grafana ,指定 grafana 调用对应 Prometheus 的 API
  • S4 : 配置 grafana ,将 API 返回的数据进行可视化的展示

有哪些 Exporter ?

  • Node Exporter:Node Exporter是Prometheus的官方Exporter之一,用于监控Linux和Unix操作系统的硬件和资源使用情况,包括CPU、内存、磁盘、网络等。
  • Blackbox Exporter:Blackbox Exporter用于执行网络探测,以监视远程服务的可用性和性能。 支持 HTTP ,DNS ,TCP 等等
  • Docker Daemon Exporter:用于监控Docker容器的性能指标,如CPU使用率、内存使用率、网络流量等
  • MySQL Exporter:用于监控MySQL数据库服务器的性能和状态,包括查询响应时间、连接数、缓冲池状态等
  • Kubernetes State Metrics:用于监控Kubernetes集群的内部状态和度量标准,如Pod数量、节点状态、部署状态等
  • Nginx Exporter:用于监控Nginx Web服务器的性能和状态,包括请求响应时间、连接数、缓存状态等
  • Redis Exporter:用于监控Redis内存数据库的性能和状态,包括键空间的使用、命令统计等
  • Elasticsearch Exporter:用于监控Elasticsearch搜索引擎的性能和集群状态,包括索引信息、节点状态等

还有很多其他的 exporter 这里就不细数了, 具体可以看官方文档 : Exporters and integrations | Prometheus

2.2 阶段总结

Prometheus 工具的使用流程基本上就出来了: 安装 exporter 抓取数据 ,Prometheus 保存这些 exporter 的信息, 最终通过 grafana 展示给前端

三. 方案详情

Prometheus 的安装有2种方式 ,Docker 和 二进制安装 :

3.1 Prometheus 安装 - Docker

  • Docker 安装辅助组件
java 复制代码
// 拉取相关镜像
docker pull prom/node-exporter
docker pull google/cadvisor
docker pull prom/prometheus
docker pull grafana/grafana

- node-exporter : 收集Linux服务器上的各种系统指标和性能数据
    - 包括CPU使用率,内存使用率,磁盘I/O等
- cadvisor :用于监视容器的开源工具,配合 Docker , K8S 一起使用,用于容器性能监控
    - 包括容器的基础性能(cpu ,内存)
    - 可以生成报告,触发报警

// S1 : 启动 node-exporter 监控应用
docker run -d --name node-exporter --restart=always -p 9100:9100 -v "/proc:/host/proc:ro" -v "/sys:/host/sys:ro" -v "/:/rootfs:ro" prom/node-exporter
- 查看启动情况 : docker ps
- 查看端口情况 : netstat -anpt
- 访问应用 : http://11.22.217.211:9100/metrics

// S2 : 启用 cadvisor 监控容器
docker run --privileged=true -v /:/rootfs:ro -v /var/run:/var/run:rw -v /sys:/sys:ro -v /var/lib/docker/:/var/lib/docker:ro -v /dev/disk/:/dev/disk:ro -p 8080:8080 -d --name=cadvisor --restart=always google/cadvisor:latest
- 访问应用 : http://11.22.217.211:8080/metrics
- 查看容器启动日志 : docker logs 4c350f0c83a0
- 删除容器 : docker container rm 4c350f0c83a0

// 补充一 : inotify_add_watch /sys/fs/cgroup/cpuacct,cpu: no such file or directory
sudo mount -o remount,rw '/sys/fs/cgroup'
sudo ln -s /sys/fs/cgroup/cpu,cpuacct /sys/fs/cgroup/cpuacct,cpu
  • Docker 安装 Prometheus
java 复制代码
// ? 如果是内部网络,可以先查询到 Docker 私网
`docker inspect -f ``'{{.Name}} - {{.NetworkSettings.IPAddress }}'` `$(docker ps -aq)`

// S1 : 先创建 Prometheus 启动需要的配置文件 
mkdir /opt/prometheus
cd /opt/prometheus/
vim prometheus.yml


// S2 : 配置上面的配置文件 prometheus
global:
  scrape_interval:     60s
  evaluation_interval: 60s
scrape_configs:
  - job_name: prometheus
    static_configs:
      - targets: ['localhost:9090']
        labels:
          instance: prometheus
  - job_name: linux
    static_configs:
      - targets: ['localhost:9100']
        labels:
          instance: localhost
  - job_name: cadvisor
    static_configs:
      - targets: ['localhost:8080']
        labels:
          instance: cAdvisor
          
// 启动  prometheus
docker run  -d --name prometheus --restart=always -p 9090:9090 -v /opt/prometheus/prometheus.yml:/etc/prometheus/prometheus.yml prom/prometheus

- 查看应用 :http://13.13.1.31:9090/graph
- 查看应用 :http://13.13.1.31:9090/targets

文件内容解析 :

  • global.scrape_interval : 全局抓取间隔,每15秒获取一次数据
  • global.evaluation_interval : 全局评估间隔,每15秒评估警报规则
  • scrape_configs.job_name : 作业名,这里用于监控Prometheus本身
  • scrape_configs.static_configs.targets : 目标,指定要监控的目标地址和端口
  • rule_files : 规则报警文件

成功启动:

3.2 Prometheus 安装 - 二进制

@ 二进制部署 Prometheus - 买定灬离手 - 博客园 (cnblogs.com)

很详细,就不重复操作了,不过相对而言,自己玩一玩 Docker 就够了。

3.3 配置 grafana

java 复制代码
// S1 : 创建前配置
- 创建存储文件夹 : mkdir /opt/grafana-storage
- 为文件添加权限 : chmod 777 -R /opt/grafana-storage

// S2 : 启动 grafana
docker run -d --name grafana --restart=always -p 3000:3000 --name=grafana -v /opt/grafana-storage:/var/lib/grafana grafana/grafana

// S3 : 访问 grafana
http://192.168.1.31:3000/

启动完成后,就需要配置关联了:

  • S1 : 在 Connect 中添加新的连接 Source
  • S2 : Source 选择 Prometheus ,配置连接信息 ,注意加 HTTP/HTTPS
  • S3 : 在 Dashboards 中直接通过模板 ID 配置

模板ID 是什么 ?

  • Dashboards 的界面并不是原生自带的,其中很多参数和图表都需要配置
  • 为了让这些配置简化已经可以互相分享自己的模板, grafana 定义了模板 ID 的盖帘
  • 我们可以通过 grafana.com/grafana/das... 查询自己喜欢的模板,然后直接通过ID进行配置

第一阶段大功告成:

四. 其他辅助功能及配置

Alertmanager

  • 功能 :管理警报。可以对警报进行静音、分组和路由,以便更好地处理警报通知。
java 复制代码
alerting: 
    alertmanagers: 
    - static_configs: 
        - targets: ['alertmanager:9093'] # Alertmanager的地址和端口

修改存储介质

@ Storage | Prometheus

Prometheus 支持本地存储 ,远程存储等多种方式,如果使用 Docker 的场景,存储最好配置成远程的

java 复制代码
--web.enable-remote-write-receiver /api/v1/write

这里我也没实现过,所以具体的就不展示了

总结

这一篇完成后,整个秒杀系列就能正式开始了,后续在压力展示的时候可以直接给大家看可视化的性能界面了。

以上只是Prometheus 的基础用法,后面还会有一些高级用法可能会单章进行处理

参考

基于docker部署Prometheus_ok: run: prometheus: (pid 3044) 693s, want down, g_北城 半夏的博客-CSDN博客

prometheus.io/

相关推荐
。puppy9 分钟前
HCIP--3实验- 链路聚合,VLAN间通讯,Super VLAN,MSTP,VRRPip配置,OSPF(静态路由,环回,缺省,空接口),NAT
运维·服务器
一只爱打拳的程序猿16 分钟前
【Spring】更加简单的将对象存入Spring中并使用
java·后端·spring
颇有几分姿色18 分钟前
深入理解 Linux 内存管理:free 命令详解
linux·运维·服务器
光芒再现dev36 分钟前
已解决,部署GPTSoVITS报错‘AsyncRequest‘ object has no attribute ‘_json_response_data‘
运维·python·gpt·语言模型·自然语言处理
AndyFrank1 小时前
mac crontab 不能使用问题简记
linux·运维·macos
时差9531 小时前
【面试题】Hive 查询:如何查找用户连续三天登录的记录
大数据·数据库·hive·sql·面试·database
成都古河云2 小时前
智慧场馆:安全、节能与智能化管理的未来
大数据·运维·人工智能·安全·智慧城市
算法与编程之美2 小时前
文件的写入与读取
linux·运维·服务器
假装我不帅2 小时前
asp.net framework从webform开始创建mvc项目
后端·asp.net·mvc