【Hadoop】Hadoop集群安装中出现的问题

1.namenode 和 secondarynamenode 启动失败

执行 start-dfs.sh 脚本,发现 namenode 和 secondarynamenode 没有启动,之后使用 hdfs namenode 命令单独启动时,报错如下:/app/hadoop/hadoop-2.6.4/name/in_use.lock 权限不足

通过下面命令查到 in_use.lock 文件的所有者和所属组都为root(uid,gid=0),所以执行命令 chown 将其都改为hadoop。

之后成功启动namenode,secondarynamenode同理。

2.主服务器上DataNode启动失败

使用hdfs datanode 命令启动后报错如下:clusterID 不匹配

解决方案:停止所有hadoop进程,删除DataNode的旧数据目录(注意:此操作会清空 DataNode 存储的数据块,测试环境可放心执行),该目录在 hdfs-site.xml 中的 dfs.datanode.data.dir 配置,重新启动 HDFS 服务。

3.子服务器上DataNode报错

先找到主服务器上的clusterID值,保证子服务器的 $HADOOP_HOME/data/current/VERSION 文件中clusterID的值与主服务器一致。之后使用命令 ./hadoop-daemon.sh start datanode 启动datanode即可。

相关推荐
摇滚侠5 小时前
Linux CentOS7 rpm 安装 MySQL 5.7
linux·运维·mysql
bush45 小时前
嵌入式linux学习记录十四、术语
linux·嵌入式
载数而行5205 小时前
Linux 11 动态监控指令top
linux
王小王-1237 小时前
基于 Hive 的网易云音乐数据分析及可视化系统
hive·hadoop·数据分析·音乐数据分析·网易云音乐分析·hive音乐分析·hadoop网易云
不会C语言的男孩7 小时前
Linux 系统编程 · 第 8 章:进程基础
linux·c语言
古城小栈7 小时前
Unix 与 Linux 异同小叙
linux·服务器·unix
极光代码工作室8 小时前
基于数据仓库的电商数据分析平台
大数据·hadoop·python·spark·数据可视化
凡人叶枫8 小时前
Effective C++ 条款42:了解 typename 的双重意义
java·linux·服务器·c++
2601_961875248 小时前
决战申论100题2026|最新|范文
linux·容器·centos·debian·ssh·fabric·vagrant
java_cj8 小时前
深入kube-apiserver认证机制:从Bearer Token到mTLS的完整认证链解析
linux·运维·服务器·云原生·容器·kubernetes