HDFS EXERCISES

复制代码
bash: hdfs: command not found...

这可能是因为hdfs命令不在系统环境变量中

复制代码
whereis hadoop

找到hadoop的位置

一旦找到Hadoop安装目录,您需要将其 bin 目录添加到PATH环境变量中。

复制代码
vi ~/.bashrc

.bashrc 是一个在Linux和Unix系统中用于Bash shell的配置文件。当你启动一个新的终端会话时,或者在命令行中启动一个新的Bash实例时,该文件会被自动读取并执行。文件中包含的命令用于配置终端会话的环境变量,别名,以及自定义命令。

是改变生效

复制代码
source ~/.bashrc

复制代码
bash: start-dfs.sh: command not found...

这通常意味着 Hadoop 的 sbin 目录 没有被添加到环境变量 PATH 中。

同上解决

$

在 Bash 和其他类 Unix 操作系统的 shell 中,$ 符号用于访问变量的值。当你在命令行或者脚本中使用 $ 符号,它告诉 shell 去获取与紧随其后的文字对应的变量的值。

当你定义了一个变量,比如 MY_VARIABLE=hello,你可以通过 $MY_VARIABLE 来访问它的值。例如,echo $MY_VARIABLE 会输出 hello

修改完之后就可以全局启动hdfs

复制代码
start-dfs.sh

查看状态我们可以发现没有datanode

我们可以手动启动datanode

复制代码
hadoop-daemon.sh start datanode

查看UI界面

先关闭防火墙

复制代码
systemctl stop firewalld    #关闭防火墙

systemctl disable firlewalld  #关闭防火墙开机启动

访问

复制代码
http://localhost:50070

在hdfs上创建文件

复制代码
hdfs dfs -mkdir /demo

一开始出现了如下错误

解决方法如下

复制代码
cd /etc
vi hosts

再重新启动

复制代码
stop-all.sh
start-all.sh

然后解决问题


我们发现没有datanode

删除hadoop/tmp时可以使用

复制代码
rm -rm tmp


Linux(CentOS7)下安装idea的详细步骤_centos7.9安装idea社区版本-CSDN博客

参考以上教程

相关推荐
XDHCOM18 小时前
ORA-32484重复列名错误,ORACLE数据库CYCLE子句故障修复与远程处理方案
数据库·oracle
云烟成雨TD18 小时前
Spring AI Alibaba 1.x 系列【6】ReactAgent 同步执行 & 流式执行
java·人工智能·spring
于慨18 小时前
Lambda 表达式、方法引用(Method Reference)语法
java·前端·servlet
swg32132118 小时前
Spring Boot 3.X Oauth2 认证服务与资源服务
java·spring boot·后端
翻斗包菜19 小时前
PostgreSQL 日常维护完全指南:从基础操作到高级运维
运维·数据库·postgresql
gelald19 小时前
SpringBoot - 自动配置原理
java·spring boot·后端
殷紫川19 小时前
深入理解 AQS:从架构到实现,解锁 Java 并发编程的核心密钥
java
呆瑜nuage19 小时前
MySQL表约束详解:8大核心约束实战指南
数据库·mysql
一轮弯弯的明月19 小时前
贝尔数求集合划分方案总数
java·笔记·蓝桥杯·学习心得
chenjingming66619 小时前
jmeter线程组设置以及串行和并行设置
java·开发语言·jmeter