DevOps监控之Prometheus实施基础指南

关注开源优测不迷路

大数据测试过程、策略及挑战

测试框架原理,构建成功的基石

在自动化测试工作之前,你应该知道的10条建议

在自动化测试中,重要的不是工具

简介

Prometheus是一个开源系统监控和警报工具包,最初在SoundCloud上构建。自2012年成立以来,许多公司和组织都采用了Prometheus,该项目拥有非常活跃的开发人员和用户社区。

它现在是一个独立的开源项目,独立于任何公司进行维护。为了强调这一点,并澄清项目的治理结构,Prometheus于2016年加入了云原生计算基金会,成为继Kubernetes之后的第二个托管项目。

Prometheus将其指标收集并存储为时间序列数据,即指标信息与记录它的时间戳一起存储,以及称为标签的可选键值对。

Prometheus server 直接从监控任务进程中拉取监控指标,也可以通过其他程序或脚本,将监控数据推送 Pushgateway,之后 Prometheus server 再从 Pushgateway 中拉取指标。

Prometheus server 将所有抓取的样本存储在本地,并对此数据运行规则,以聚合和记录现有数据中的新时间序列或生成警报。

Grafana 或其他 API 使用者可用于可视化收集的数据。

架构图

架构组件说明

系统由多个组件组成,其中许多组件是可选的:

  • Prometheus server 主要组件,用于抓取和存储时间序列数据

  • client libraries, 用于检测应用程序代码

  • Push gateway 支持短期作业的推送

  • Exporters,用于监控特殊服务,如HAProxy,StatsD,Graphite等服务

  • alertmanager 用于处理警报

  • 各种支持工具大多数Prometheus组件都是用Go编写的,这使得它们易于构建和部署为静态二进制文件。

特性说明

  • 具有由指标名称和键/值对标识的时间序列数据的多维数据模型

  • PromQL,一种灵活的查询语言,可利用这种维度

  • 不依赖分布式存储;单个服务器节点是自治的

  • 时序收集通过 HTTP 上的拉取模型进行

  • 通过中间网关支持推送时间序列

  • 通过服务发现或静态配置发现目标

  • 多种模式的绘图和仪表板支持

应用场景

  • Prometheus非常适合记录任何纯数字时间序列。

  • 既适合以机器为中心的监视,也适合监视高度动态的面向服务的体系结构。

  • 在微服务世界中,它对多维数据收集和查询的支持是一个特别的优势。

  • 每个Prometheus服务器都是独立的,不依赖于网络存储或其他远程服务。

相关推荐
HY小海4 小时前
【Linux】进程概念
linux·运维·服务器
王八八。4 小时前
linux后台java、postSQL部署命令
java·linux·运维
TheRouter5 小时前
LLM 应用的Evals 工程实践:从手动测试到自动化回归测试体系
运维·ai·自动化·log4j
黎阳之光6 小时前
黎阳之光:以视频孪生重构智慧防火,打造“天空地人智”一体化森林防火新范式
大数据·运维·人工智能·物联网·安全
utf8mb4安全女神8 小时前
Linux系统服务相关命令【定时任务设置】【任务进程管理】【防火墙区域应用】
linux·运维·服务器
凯丨8 小时前
Claude Code 自动化开发的完整体系
运维·自动化
SilentSamsara11 小时前
concurrent.futures 实战:进程池与线程池的统一抽象
运维·开发语言·python·青少年编程
疯狂成瘾者11 小时前
常见的 Linux 版本
linux·运维·服务器
xingyuzhisuan12 小时前
GPU服务器集群搭建指南——选型、部署、优化+避坑全解析
运维·服务器·人工智能·gpu算力
Patrick_Wilson12 小时前
写给前端的 K8s 入门:用一张图和一个例子搞懂 5 个核心概念
云原生·kubernetes·devops