Prometheus云原生监控笔记

监控是一门学问,也是一门艺术。

You build it,you run it,you monitor it.

事后监控、不完整监控、不正确监控、不准确监控、静态监控、不频繁的监控、缺少自动化或自服务的监控,都是不完善的监控手法。

建立完善的监控体系

1)趋势分析

2)对照分析

3)告警

4)故障分析与定位

5)数据可视化

监控系统分为端监控、业务层监控、应用层监控、中间件监控、系统层监控这5层。

Apache的SkyWalking、百度的DP、美团的CAT、蚂蚁金服的九色鹿、宜信的UAVstack、滴滴的Omega、360和头条的Sentry、腾讯的badjs、阿里云的arms,以及已经商业化的Fundbug、听云和神策等

云原生计算基金会在其Landscape中将可观察性和数据分析单独列为一个分类------Observability and Analysis,这个分类主要包括Monitoring、Logging、Tracing、Chaos Engineering这4个子类。

时序数据库解决方案以Graphite、TICK[3]和Prometheus等为代表,其中前两个是推模式,后一个则以拉模式为主,拉模式对整体代码和架构的侵入较小。

当代新的监控三要素为Metrics、Logging和Tracing。

相关推荐
哈里谢顿10 小时前
Kubernetes Operator核心概念、实现原理和实战开发
云原生
tingshuo291710 小时前
S001 【模板】从前缀函数到KMP应用 字符串匹配 字符串周期
笔记
阿里云云原生15 小时前
你的 OpenClaw 真的在受控运行吗?
云原生
阿里云云原生15 小时前
5 分钟零代码改造,让 Go 应用自动获得全链路可观测能力
云原生·go
Shanyoufusu1216 小时前
RKE2 单节点集群安装 Rancher+ 私有镜像仓库搭建 完整教程
云原生
阿里云云原生16 小时前
Dify 官方上架 Higress 插件,轻松接入 AI 网关访问模型服务
云原生
AI攻城狮18 小时前
OpenClaw Session 管理完全指南:Context 压缩、重置与持久化
人工智能·云原生·aigc
阿里云云原生5 天前
阿里云获评 Agentic AI 开发平台领导者,函数计算 AgentRun 赢下关键分!
云原生
阿里云云原生5 天前
MSE Nacos Prompt 管理:让 AI Agent 的核心配置真正可治理
微服务·云原生
阿里云云原生5 天前
当 AI Agent 接管手机:移动端如何进行观测
云原生·agent