监控是一门学问,也是一门艺术。
You build it,you run it,you monitor it.
事后监控、不完整监控、不正确监控、不准确监控、静态监控、不频繁的监控、缺少自动化或自服务的监控,都是不完善的监控手法。
建立完善的监控体系
1)趋势分析
2)对照分析
3)告警
4)故障分析与定位
5)数据可视化
监控系统分为端监控、业务层监控、应用层监控、中间件监控、系统层监控这5层。
Apache的SkyWalking、百度的DP、美团的CAT、蚂蚁金服的九色鹿、宜信的UAVstack、滴滴的Omega、360和头条的Sentry、腾讯的badjs、阿里云的arms,以及已经商业化的Fundbug、听云和神策等
云原生计算基金会在其Landscape中将可观察性和数据分析单独列为一个分类------Observability and Analysis,这个分类主要包括Monitoring、Logging、Tracing、Chaos Engineering这4个子类。
时序数据库解决方案以Graphite、TICK[3]和Prometheus等为代表,其中前两个是推模式,后一个则以拉模式为主,拉模式对整体代码和架构的侵入较小。
当代新的监控三要素为Metrics、Logging和Tracing。