【运维监控】Prometheus+grafana监控zookeeper运行情况


文章目录


  • 本示例通过zookeeper自带的监控信息暴露出来,然后将数据收集到prometheus中,最后通过grafana的dashboard导入模板进行可视化。
  • 本示例分为三个部分,即prometheus、grafana部署和最后的集成。
  • 说明:本示例中的部署环境没有要求,即应用部署的机器根据实际情况而定,只要网络连通即可。

一、prometheus

参考:【运维监控】prometheus+node exporter+grafana 监控linux机器运行情况关于prometheus的部署。

二、grafana

参考:【运维监控】prometheus+node exporter+grafana 监控linux机器运行情况 关于grafana的部署。

三、prometheus集成grafana监控zookeeper

为了更加方便的集成prometheus,建议使用3.6.0以后的版本,因为这个版本以后zookeeper加入了prometheus集成监控,只需要开启zookeeper的指标配置即可。在这个版本之前的zookeeper,可能需要通过JMX进行监控。

本示例使用的版本是zookeeper 3.7.1,也是比较老的版本了,最新的版本是3.9.2。

1、修改zookeeper配置

在你原有的配置文件zoo.cnf内容的基础上,启用zookeeper的指标配置。如果是集群环境,则需要每个zookeeper的配置文件都需要修改。

bash 复制代码
cd /apache-zookeeper-3.7.1/conf
vim zoo.cnf
# 启用以下三个属性值即可
## Metrics Providers
#
# https://prometheus.io Metrics Exporter
metricsProvider.className=org.apache.zookeeper.metrics.prometheus.PrometheusMetricsProvider
metricsProvider.httpPort=7000
metricsProvider.exportJvmInfo=true

2、修改prometheus配置

在prometheus的配置文件(prometheus.yml)中添加如下配置部分。作者的zookeeper是集群环境,即部署在server1、server2和server3服务器上。

bash 复制代码
  - job_name: "zookeeper-monitor"
    static_configs:
      - targets: ["server1:7000","server2:7000","server3:7000"]

重启prometheus后,并验证是否收集到监控信息。

查看Prometheus是否监控到运行的zookeeper应用如下图。

查看prometheus是否收集到监控信息如下图(查询jvm_threads_state{state="NEW", job="zookeeper-monitor"})

3、导入grafana模板

导入过程不再赘述,参考文章:【运维监控】Prometheus+grafana监控tomcat8.5 运行情况

本示例导入的模板ID是10465(ZooKeeper by Prometheus)。

4、验证

以上所涉及的服务均能正常的运行,以及验证都通过。

点击添加的zookeeper模板,选择zookeeper集群,则显示如下图所示。

以上,则完成了Prometheus+grafana监控zookeeper运行情况的示例。

相关推荐
忧郁的橙子.2 分钟前
02-本地部署Ollama、Python
linux·运维·服务器
醇氧11 分钟前
【linux】查看发行版信息
linux·运维·服务器
No8g攻城狮44 分钟前
【Linux】Windows11 安装 WSL2 并运行 Ubuntu 22.04 详细操作步骤
linux·运维·ubuntu
酷酷的崽7981 小时前
CANN 生态可维护性与可观测性:构建生产级边缘 AI 系统的运维体系
运维·人工智能
做人不要太理性1 小时前
CANN Runtime 运行时组件深度解析:任务调度机制、存储管理策略与维测体系构建逻辑
android·运维·魔珐星云
XiaoFan0121 小时前
免密批量抓取日志并集中输出
java·linux·服务器
souyuanzhanvip1 小时前
ServerBox v1.0.1316 跨平台 Linux 服务器管理工具
linux·运维·服务器
文静小土豆1 小时前
Docker 与 containerd 代理配置详解:镜像拉取速度慢的终极解决方案
运维·docker·容器
YongCheng_Liang2 小时前
从零开始学 Python:自动化 / 运维开发实战(核心库 + 3 大实战场景)
python·自动化·运维开发
HalvmånEver3 小时前
Linux:线程互斥
java·linux·运维