监控基本概念

监控:这个词在不同的上下文中有不同的含义,在讲到监控MySQL或者监控Redis时,这里只涉及数据采集和可视化,不涉及告警引擎和事件处理。要是监控系统的话,不但包括数据采集和可视化,而且也包括告警和事件发送等相关功能。

监控指标:数值类型的监控数据

监控指标三种典型的描述方式:

1.全局唯一字符串作为指标标识。

2.标签集的组合作为指标标识

3.优雅高效的 Influx 指标格式

监控系统核心两个核心能力:监控和告警

指标类型:RRDtool 还提出了数据类型的概念,支持 GAUGE、COUNTER、DERIVE、DCOUNTER、DDERIVE、ABSOLUTE 等多种数据类型。Prometheus 生态也支持数据类型,分为 Gauge、Counter、Histogram、Summary等4 种。

Gauge:测量值类型,可大可小,可正可负,通常关注的是当前值。

Counter:表示单调递增的值,比如操作系统自启动以来网卡接收到的所有流量包的数量。

Histogram:直方图类型,用于描述数据分布,最典型的应用场景就是监控延迟数据。

Summary:在客户端计算分位值,然后把计算之后的结果推给服务端存储,展示的时候直接查询即可。

划分指标类型最主要的作用:在采集侧埋点的时候,SDK 会根据数据类型做不同的计算逻辑。

时序库:专门处理时序数据的数据库,英文全称为Time series database。

时序数据最大的特点:每一条数据都带有时间戳,通常是单调顺序,不会乱序,流式发给服务端,通常不会修改。

告警收敛:让告警事件变少的方法。

告警闭环:最终被解决,告警恢复。

此文章为9月Day 6学习笔记,内容来源于极客时间《运维监控系统实战笔记》

相关推荐
云边有个稻草人2 小时前
打工人摸鱼新姿势!轻量斗地主服务器,内网穿透让同事远程联机不翻车
运维·服务器·cpolar
乾元2 小时前
终端安全(EDR):用深度学习识别未知勒索软件
运维·人工智能·网络协议·安全·网络安全·自动化·安全架构
wbs_scy2 小时前
Linux 进阶指令实操指南:文件查看、时间管理、搜索压缩全场景覆盖(附高频案例)
linux·运维·服务器
安科瑞刘鸿鹏172 小时前
高速路灯故障难定位?用 ASL600 实现精确单灯监测与维护预警
运维·网络·物联网·安全
馨谙2 小时前
Ansible 事实(Facts)全面指南:自动化运维中的主机信息管理
运维·ansible
Lethehong2 小时前
实测可用|一文搞定OpenClaw部署,免费kimi-k2.5+飞书远程,新手也能秒上手
linux·运维·服务器·玩转openclaw·云端创意实践
馨谙3 小时前
Ansible处理程序完全指南:实现智能的任务触发机制
运维·ansible
承渊政道3 小时前
Linux系统学习【Linux基础开发工具】
linux·运维·笔记·学习·centos·编辑器
艾莉丝努力练剑3 小时前
【Linux:文件】基础IO
linux·运维·c语言·c++·人工智能·io·文件
脏脏a3 小时前
告别物理出勤:Nginx 搭配 cpolar 实现远程开发无缝协作
运维·nginx