Hadoop3:HDFS-查看logs文件,排查NameNode故障原因。

问题一、NameNode进程退出

我们发现,NameNode进程不存在。

情况1、单独启动NameNode

bash 复制代码
hdfs --daemon start namenode

能够正常拉起,那就没问题

情况2、无法独立启动NameNode

先尝试启动NameNode

bash 复制代码
hdfs --daemon start namenode

发现,没能成功启动

查看日志文件

bash 复制代码
tail -n 100 hadoop-atguigu-namenode-hadoop102.log

从报错信息看,是NameNode没有格式化。

但是,我们是格式化后,才启动的集群。

具体是文件没找到:
/opt/module/hadoop-3.1.3/data/dfs/name/in_use.lock

我们去改目录查看下情况

说明,可能NameNode的数据被误删了。

解决

2nn节点上,拷贝元数据到相应目录即可。

我们,知道2nn和nn差别就在于少了一个progress文件。

进入2nn元数据目录

bash 复制代码
cd /opt/module/hadoop-3.1.3/data/dfs/namesecondary

拷贝数据

bash 复制代码
scp -r atguigu@hadoop104:/opt/module/hadoop-3.1.3/data/dfs/namesecondary/* /opt/module/hadoop-3.1.3/data/dfs/name

再次启动NameNode进程

测试删除

显示进群处于安全模式

退出安全模式

bash 复制代码
hdfs dfsadmin -safemode forceExit

就可以正常使用了。

相关推荐
二二孚日1 小时前
自用华为ICT云赛道Big Data第四章知识点-Flink流批一体分布式实时处理引擎
大数据·华为
xufwind2 小时前
spark standlone 集群离线安装
大数据·分布式·spark
AI数据皮皮侠3 小时前
中国区域10m空间分辨率楼高数据集(全国/分省/分市/免费数据)
大数据·人工智能·机器学习·分类·业界资讯
DeepSeek大模型官方教程4 小时前
NLP之文本纠错开源大模型:兼看语音大模型总结
大数据·人工智能·ai·自然语言处理·大模型·产品经理·大模型学习
大数据CLUB5 小时前
基于spark的奥运会奖牌变化数据分析
大数据·hadoop·数据分析·spark
Edingbrugh.南空5 小时前
Hadoop高可用集群搭建
大数据·hadoop·分布式
智慧化智能化数字化方案6 小时前
69页全面预算管理体系的框架与落地【附全文阅读】
大数据·人工智能·全面预算管理·智慧财务·智慧预算
武子康6 小时前
大数据-33 HBase 整体架构 HMaster HRegion
大数据·后端·hbase
诗旸的技术记录与分享20 小时前
Flink-1.19.0源码详解-番外补充3-StreamGraph图
大数据·flink
资讯分享周20 小时前
Alpha系统联结大数据、GPT两大功能,助力律所管理降本增效
大数据·gpt