cdp集群Hbase组件HRegionServer服务停止原因以及排查

前言:重启集群后某一节点HRegionServer服务停止,重启前所有服务均正常

去查看日志:

日志报错

ERROR HRegionServer

Master rejected startup because clock is out of sync

org.apache.hadoop.hbase.ClockOutOfSyncException: org.apache.hadoop.hbase.ClockOutOfSyncException: Server cloudcdp05.hadoop.com,16020,1713404049250 has been rejected; Reported time is too far out of sync with master. Time difference of 31113ms > max allowed of 30000ms

09:34:20.321 ERROR HRegionServerCommandLine

Region server exiting

java.lang.RuntimeException: HRegionServer Aborted

HBase 主节点拒绝了某个区域服务器的启动,因为区域服务器的系统时钟与主节点的系统时钟相差太大。

去查看对应节点后台,发现ntp服务正常启动,但是没有与主节点进行时间同步

怀疑是主节点ntp服务没启起来,去主节点查看ntp是active状态,

可能是没识别问题节点,把主节点和问题节点的ntp服务重启一下就好了

powershell 复制代码
#重启ntp服务
systemcl restart ntpd

后续查看同步状态

powershell 复制代码
ntp -q

可以看到时间同步过去了,问题解决。

相关推荐
追寻上飞5 小时前
【常读常悟】《大数据之路-阿里巴巴大数据实践》一书读书摘要
大数据·智能算法
YancyYue6 小时前
ACL(Access Control List)访问控制列表
运维·服务器
GoppViper7 小时前
Linux 性能调优技巧
linux·运维·服务器
DC_BLOG8 小时前
VPN简述
运维·服务器·网络·ip
MarkHD8 小时前
Flink集群部署
大数据·flink
bin91539 小时前
【EXCEL数据处理】000011 案列 EXCEL带有三角形图标的单元格转换,和文本日期格式转换。
大数据·数据库·信息可视化·数据挖掘·数据分析·excel·数据可视化
醉颜凉9 小时前
银河麒麟系统内存清理
运维·服务器·kylin·国产化·银河麒麟操作系统
Zfox_10 小时前
【Linux】进程地址空间、环境变量:从理论到实践(三)
java·linux·运维
Data 31710 小时前
Hive数仓操作(四)
大数据·数据库·数据仓库·hive·hadoop
Mephisto.java10 小时前
【大数据入门 | Hive】Join语句
数据仓库·hive·hadoop