Hadoop3:HDFS-查看logs文件,排查NameNode故障原因。

问题一、NameNode进程退出

我们发现,NameNode进程不存在。

情况1、单独启动NameNode

bash 复制代码
hdfs --daemon start namenode

能够正常拉起,那就没问题

情况2、无法独立启动NameNode

先尝试启动NameNode

bash 复制代码
hdfs --daemon start namenode

发现,没能成功启动

查看日志文件

bash 复制代码
tail -n 100 hadoop-atguigu-namenode-hadoop102.log

从报错信息看,是NameNode没有格式化。

但是,我们是格式化后,才启动的集群。

具体是文件没找到:
/opt/module/hadoop-3.1.3/data/dfs/name/in_use.lock

我们去改目录查看下情况

说明,可能NameNode的数据被误删了。

解决

2nn节点上,拷贝元数据到相应目录即可。

我们,知道2nn和nn差别就在于少了一个progress文件。

进入2nn元数据目录

bash 复制代码
cd /opt/module/hadoop-3.1.3/data/dfs/namesecondary

拷贝数据

bash 复制代码
scp -r atguigu@hadoop104:/opt/module/hadoop-3.1.3/data/dfs/namesecondary/* /opt/module/hadoop-3.1.3/data/dfs/name

再次启动NameNode进程

测试删除

显示进群处于安全模式

退出安全模式

bash 复制代码
hdfs dfsadmin -safemode forceExit

就可以正常使用了。

相关推荐
SelectDB3 小时前
Apache Doris Python UDF:让 SQL 直接调用 Python 生态,支撑 Agent 时代复杂业务逻辑
大数据·数据库·python
ApacheSeaTunnel6 小时前
当多表数据涌入,Apache SeaTunnel 如何巧妙化解主键冲突?
大数据·开源·数据集成·seatunnel·技术分享·数据同步
大大大大晴天3 天前
Hudi Metadata Table 与 Hive Sync (HMS)怎么选?
大数据
手可摘星辰7773 天前
一次线上FlinkCDC异常排查复盘
大数据·flink
大大大大晴天3 天前
Hudi技术内幕:Metadata Table原理与实践
大数据
大大大大晴天4 天前
Hudi技术内幕:深入解析Index索引机制
大数据
阿里云大数据AI技术5 天前
Flink Forward Asia 2026 深圳启幕:Agentic Streaming for AI,开启实时智能新范式
大数据·flink
SelectDB5 天前
阶跃星辰基于 SelectDB 构建 PB 级 Agent 可观测平台
大数据·数据库·aigc
大大大大晴天8 天前
Hudi技术内幕:RecordPayload到RecordMerger
大数据
SelectDB9 天前
秒级弹性、最高降本 70%:SelectDB Serverless 如何重塑云数仓资源效率
大数据·后端·云原生