cdp集群Hbase组件HRegionServer服务停止原因以及排查

前言:重启集群后某一节点HRegionServer服务停止,重启前所有服务均正常

去查看日志:

日志报错

ERROR HRegionServer

Master rejected startup because clock is out of sync

org.apache.hadoop.hbase.ClockOutOfSyncException: org.apache.hadoop.hbase.ClockOutOfSyncException: Server cloudcdp05.hadoop.com,16020,1713404049250 has been rejected; Reported time is too far out of sync with master. Time difference of 31113ms > max allowed of 30000ms

09:34:20.321 ERROR HRegionServerCommandLine

Region server exiting

java.lang.RuntimeException: HRegionServer Aborted

HBase 主节点拒绝了某个区域服务器的启动,因为区域服务器的系统时钟与主节点的系统时钟相差太大。

去查看对应节点后台,发现ntp服务正常启动,但是没有与主节点进行时间同步

怀疑是主节点ntp服务没启起来,去主节点查看ntp是active状态,

可能是没识别问题节点,把主节点和问题节点的ntp服务重启一下就好了

powershell 复制代码
#重启ntp服务
systemcl restart ntpd

后续查看同步状态

powershell 复制代码
ntp -q

可以看到时间同步过去了,问题解决。

相关推荐
cykaw25901 分钟前
Linux和Ubuntu的关系
linux·运维·服务器
Python私教19 分钟前
Ubuntu 22 安装 NVM 详细步骤及常见问题解决方案
linux·运维·ubuntu
九河云38 分钟前
华为云国内版与国际版的差异
大数据·服务器·华为云
挥之以墨1 小时前
【Nginx】核心概念与安装配置解释
运维·nginx
筱小虾米3 小时前
解决SSL VPN客户端一直提示无法连接服务器的问题
运维·服务器
dntktop5 小时前
内嵌编辑器+AI助手,Wave Terminal打造终端新体验
运维
kaiyuanheshang7 小时前
docker 中的entrypoint和cmd指令
运维·docker·容器·cmd·entrypoint
wanhengwangluo8 小时前
裸金属服务器能够帮助企业解决哪些问题?
运维·服务器
Yz98768 小时前
Hive的基础函数-日期函数
大数据·数据仓库·hive·hadoop·sql·数据库架构·big data
Python私教8 小时前
除了 Docker,还有哪些类似的容器技术?
运维·docker·容器