监控告警

观测云1 个月前
云原生·监控告警
观测云突变告警,精准预测云原生的系统异常观测云 DataKit 是一个强大的数据采集工具,能够收集和监控容器化环境和 Kubernetes 集群的指标、对象和日志数据。通过灵活使用 DataKit 收集的数据,可以对 Kubernetes 集群进行深入的监控和分析,从而实现更好的运维和优化。以下是一些使用 DataKit 来优化 Kubernetes 监控和分析的建议:
Coder-D3 个月前
kafka·promql·监控告警
Kafka-exporter监控消费速度与生产速度差异规则max by(topic, consumergroup) (sum by(topic, partition, consumergroup) (increase(kafka_consumergroup_current_offset{}[2m])) / on(topic, partition) group_left() sum by(topic, partition) (increase(kafka_topic_partition_current_offset[2m])) <= 0.8 and sum by(
架构成长指南8 个月前
云原生·prometheus·监控告警·victoriametrics
Prometheus 与 VictoriaMetrics对比公众号「架构成长指南」,专注于生产实践、云原生、分布式系统、大数据技术分享时序数据库有很多,比如Prometheus、M3DB、TimescaleDB、OpenTSDB、InfluxDB等等。Prometheus和VictoriaMetrics是开源的时间序列数据库,在复杂的环境中提供了强大的监控和警报解决方案。然而,它们的设计不同,并提供了独特的功能,这些功能可能会影响它们在监视工作负载方面的性能、可扩展性和易用性。本文分析Prometheus和VictoriaMetrics之间的差异,以为特定需求的用
架构成长指南9 个月前
云原生·prometheus·可观测性·监控告警
如何使用Promethues监控系统指标并进行告警公众号「架构成长指南」,专注于生产实践、云原生、分布式系统、大数据技术分享。从零开始:使用Prometheus与Grafana搭建监控系统
架构成长指南9 个月前
云原生·k8s·监控告警
一文搞定K8S监控告警平台选型公众号「架构成长指南」,专注于生产实践、云原生、分布式系统、大数据技术分享最近在搞K8S的监控告警平台选型,对比了目前比较流行两款开源平台kube-prometheus、夜莺,也踩了一些坑分享一下
观测云9 个月前
监控告警·智能监控·告警策略
智能联动第三方告警中心,完美实现故障响应全闭环我们曾讨论完善的告警策略是整个数据监控系统的重要组成部分(参见《机智的告警策略,完善监控系统的重要一环》),介绍了如何配置告警通知以及场景示例,帮助用户及时更多潜在的故障和问题,有效地保障系统稳定运行和持续优化。为了实现故障发现、告警、处理的全闭环,我们可以利用 Webhook 或者本地 DataFlux Func 联动第三方告警响应中心,建立一个自动化的故障处理流程,提高系统的稳定性和可靠性。本文将介绍在观测云中如何配置 Webhook 和本地 DataFlux Func 连接第三方系统,从而发送告警通
观测云10 个月前
ssl证书·智能巡检·监控告警
快速实现一个企业级域名 SSL 证书有效期监控巡检系统现在对于企业来说,HTTPS 已经不是可选项,已经成为一个必选项。HTTPS 协议采用 SSL 协议,采用公开密钥的技术,提供了一套 TCP/IP 传输层数据加密的机制。SSL 证书是一种遵守 SSL 协议的服务器数字证书,一般是由权威机构颁发给网站的可信凭证。SSL 证书是有过期时间的限制的,从 2020 年的 9 月以后,权威机构颁发的 SSL 证书的最长有效期被限制在 398 天以内,也就是说,基本上每个网站都需要每年更新或者替换一次 SSL 证书,不然证书过期会导致网站无法访问、数据被暴露等各种风