Hadoop3：HDFS-查看logs文件，排查NameNode故障原因。

生产队队长2024-07-16 10:06

我们发现，NameNode进程不存在。

bash 复制代码

hdfs --daemon start namenode

能够正常拉起，那就没问题

先尝试启动NameNode

bash 复制代码

hdfs --daemon start namenode

发现，没能成功启动

查看日志文件

bash 复制代码

tail -n 100 hadoop-atguigu-namenode-hadoop102.log

从报错信息看，是NameNode没有格式化。

但是，我们是格式化后，才启动的集群。

具体是文件没找到：
/opt/module/hadoop-3.1.3/data/dfs/name/in_use.lock

我们去改目录查看下情况

说明，可能NameNode的数据被误删了。

解决

从2nn节点上，拷贝元数据到相应目录即可。

我们，知道2nn和nn差别就在于少了一个progress文件。

进入2nn元数据目录

bash 复制代码

cd /opt/module/hadoop-3.1.3/data/dfs/namesecondary

拷贝数据

bash 复制代码

scp -r atguigu@hadoop104:/opt/module/hadoop-3.1.3/data/dfs/namesecondary/* /opt/module/hadoop-3.1.3/data/dfs/name

再次启动NameNode进程

测试删除

显示进群处于安全模式

退出安全模式

bash 复制代码

hdfs dfsadmin -safemode forceExit

就可以正常使用了。