详解zookeeper四字命令

ZooKeeper 的四字命令(Four-Letter Words, 4LW)是一组简单的管理和监控命令,方便运维人员快速获取 ZooKeeper 集群和节点的运行状态。这些命令通常用于健康检查、性能监控、节点配置查看等操作。通过这些命令,可以轻松获取关于 ZooKeeper 服务的关键信息。

四字命令可以通过 TCP 连接直接向 ZooKeeper 服务器发送请求,ZooKeeper 服务会返回相应的状态信息。这些命令只接受四个字母输入,故称为"四字命令"。

ZooKeeper 四字命令详解

1. ruok
  • 功能:检查 ZooKeeper 服务节点是否正常运行。

  • 用法

    复制代码
    echo ruok | nc 127.0.0.1 2181
  • 返回imok 表示节点健康运行。如果没有响应,可能是节点宕机或网络不通。

  • 用途:通常用于健康检查,特别适合用在负载均衡器或监控系统中确认服务是否存活。

2. stat
  • 功能:获取 ZooKeeper 节点的详细状态信息。

  • 用法

    复制代码
    echo stat | nc 127.0.0.1 2181
  • 返回

    • 服务器版本
    • 当前节点连接的客户端数
    • 请求的接收/发送数量
    • 节点角色(Leader/Follower/Standalone)
    • 节点的延迟统计等
  • 用途:用于查看 ZooKeeper 节点的整体运行状况,包括连接数和角色等。

3. srvr
  • 功能 :类似于 stat 命令,但不包括客户端的详细信息。

  • 用法

    复制代码
    echo srvr | nc 127.0.0.1 2181
  • 返回:返回服务器版本、节点角色(Leader/Follower)、会话数、zxid(事务ID)等。

  • 用途:用于快速查看 ZooKeeper 节点的基本状态,尤其是节点的角色。

4. conf
  • 功能:查看 ZooKeeper 节点的配置信息。

  • 用法

    复制代码
    echo conf | nc 127.0.0.1 2181
  • 返回 :当前 ZooKeeper 配置参数,如 clientPortdataDirtickTime 等等。

  • 用途:用于确认 ZooKeeper 节点的配置,特别适合检查多节点集群中节点配置的一致性。

5. mntr
  • 功能:提供详细的监控指标信息。

  • 用法

    复制代码
    echo mntr | nc 127.0.0.1 2181
  • 返回

    • zk_version:ZooKeeper 版本
    • zk_avg_latency:请求的平均延迟
    • zk_max_latency:最大延迟
    • zk_packets_received:接收到的请求数
    • zk_packets_sent:发送的响应数
    • zk_num_alive_connections:当前活动连接数
    • zk_outstanding_requests:未处理的请求数
  • 用途:适合监控 ZooKeeper 节点性能和负载情况,常与外部监控系统集成。

6. wchs
  • 功能:查看监控(watchers)相关信息。

  • 用法

    复制代码
    echo wchs | nc 127.0.0.1 2181
  • 返回:关于 ZooKeeper 中监控器(watchers)的统计数据,包括监控的路径和设置监控的客户端数量。

  • 用途:用于调试和查看 ZooKeeper 的 watch 机制。

7. wchc
  • 功能:显示设置了监视器的客户端的详细信息。

  • 用法

    复制代码
    echo wchc | nc 127.0.0.1 2181
  • 返回:列出每个客户端 session 和其监控的详细信息。

  • 用途:用于追踪客户端的监控器设置,调试复杂的 watch 场景。

8. wchp
  • 功能:显示被监控的 ZNode 路径。

  • 用法

    复制代码
    echo wchp | nc 127.0.0.1 2181
  • 返回:列出所有被监控的 ZNode 路径。

  • 用途:调试哪些节点设置了监控(watch),帮助识别被过度监控的路径。

9. cons
  • 功能:查看当前连接到 ZooKeeper 的客户端信息。

  • 用法

    复制代码
    echo cons | nc 127.0.0.1 2181
  • 返回:列出所有连接的客户端信息,包括 IP 地址、连接时间、会话 ID 等。

  • 用途:监控哪些客户端正在连接 ZooKeeper,特别在处理性能问题时有用。

10. envi
  • 功能:显示 ZooKeeper 节点的环境变量。

  • 用法

    复制代码
    echo envi | nc 127.0.0.1 2181
  • 返回:JVM 环境信息、操作系统信息、ZooKeeper 启动参数等。

  • 用途:调试 ZooKeeper 运行环境,适合检查 JVM 配置问题或运行环境不一致的情况。

11. dump
  • 功能:显示与 Leader 节点相关的会话信息(仅在 Leader 节点上有效)。

  • 用法

    复制代码
    echo dump | nc 127.0.0.1 2181
  • 返回:列出当前 Leader 管理的会话和临时节点。

  • 用途:调试 Leader 节点的会话管理和数据一致性问题。

12. srst
  • 功能:重置统计信息。

  • 用法

    复制代码
    echo srst | nc 127.0.0.1 2181
  • 返回:无输出,仅重置统计数据。

  • 用途:在性能调试或基准测试中用于清除当前统计信息以进行新一轮测试。

13. crst
  • 功能:重置连接统计信息。

  • 用法

    复制代码
    echo crst | nc 127.0.0.1 2181
  • 返回:无输出,仅重置连接统计数据。

  • 用途:用于清除当前连接的统计信息,通常用于调试连接问题。

14. dirs
  • 功能:显示当前节点的数据目录及事务日志目录的大小。

  • 用法

    复制代码
    echo dirs | nc 127.0.0.1 2181
  • 返回:列出数据目录和事务日志目录的大小(以字节为单位)。

  • 用途:用于监控 ZooKeeper 数据存储的磁盘使用情况。

所有四字命令的列表

  • ruok:检查节点健康状况。
  • stat:获取节点状态信息。
  • srvr:获取节点服务器信息。
  • conf:获取节点配置。
  • mntr:获取详细监控数据。
  • wchs:查看监控器统计信息。
  • wchc:查看设置监控器的客户端。
  • wchp:查看被监控的路径。
  • cons:查看当前连接的客户端信息。
  • envi:显示节点环境变量。
  • dump:查看 Leader 节点的会话信息。
  • srst:重置统计数据。
  • crst:重置连接统计数据。
  • dirs:显示数据目录和日志目录的大小。

如何启用或限制四字命令

从 ZooKeeper 3.5 版本开始,你可以通过 zoo.cfg 配置文件中的 4lw.commands.whitelist 参数来控制哪些四字命令可以被执行:

  • 启用所有命令

    复制代码
    4lw.commands.whitelist=*
  • 启用特定命令 (如 ruokstat):

    复制代码
    4lw.commands.whitelist=ruok,stat

修改配置文件后,重启 ZooKeeper 以生效:

复制代码
zkServer.sh restart

小结

ZooKeeper 的四字命令为运维人员提供了一种快速、轻量的方式来监控和管理节点的状态和健康。通过这些命令,能够轻松诊断集群运行问题并进行健康检查。

相关推荐
安顾里1 小时前
Linux命令-iostat
linux·运维·服务器
100编程朱老师2 小时前
面试:什么叫Linux多路复用 ?
linux·运维·服务器
群联云防护小杜2 小时前
云服务器主动防御策略与自动化防护(下)
运维·服务器·分布式·安全·自动化·音视频
PPIO派欧云2 小时前
PPIO X OWL:一键开启任务自动化的高效革命
运维·人工智能·自动化·github·api·教程·ppio派欧云
struggle20253 小时前
LinuxAgent开源程序是一款智能运维助手,通过接入 DeepSeek API 实现对 Linux 终端的自然语言控制,帮助用户更高效地进行系统运维工作
linux·运维·服务器·人工智能·自动化·deepseek
雨声不在5 小时前
debian切换用户
linux·服务器·debian
不知名。。。。。。。。5 小时前
Linux—— 版本控制器Git
linux·运维·git
遇到我又惊又喜5 小时前
佛山大旺高新区3650 M5 ERP服务器维修案例
运维·服务器
安全系统学习7 小时前
网络安全之红队LLM的大模型自动化越狱
运维·人工智能·安全·web安全·机器学习·php
2302_799525747 小时前
【Linux】第十二章 安装和更新软件包
linux·运维·服务器