HDFS EXERCISES

复制代码
bash: hdfs: command not found...

这可能是因为hdfs命令不在系统环境变量中

复制代码
whereis hadoop

找到hadoop的位置

一旦找到Hadoop安装目录,您需要将其 bin 目录添加到PATH环境变量中。

复制代码
vi ~/.bashrc

.bashrc 是一个在Linux和Unix系统中用于Bash shell的配置文件。当你启动一个新的终端会话时,或者在命令行中启动一个新的Bash实例时,该文件会被自动读取并执行。文件中包含的命令用于配置终端会话的环境变量,别名,以及自定义命令。

是改变生效

复制代码
source ~/.bashrc

复制代码
bash: start-dfs.sh: command not found...

这通常意味着 Hadoop 的 sbin 目录 没有被添加到环境变量 PATH 中。

同上解决

$

在 Bash 和其他类 Unix 操作系统的 shell 中,$ 符号用于访问变量的值。当你在命令行或者脚本中使用 $ 符号,它告诉 shell 去获取与紧随其后的文字对应的变量的值。

当你定义了一个变量,比如 MY_VARIABLE=hello,你可以通过 $MY_VARIABLE 来访问它的值。例如,echo $MY_VARIABLE 会输出 hello

修改完之后就可以全局启动hdfs

复制代码
start-dfs.sh

查看状态我们可以发现没有datanode

我们可以手动启动datanode

复制代码
hadoop-daemon.sh start datanode

查看UI界面

先关闭防火墙

复制代码
systemctl stop firewalld    #关闭防火墙

systemctl disable firlewalld  #关闭防火墙开机启动

访问

复制代码
http://localhost:50070

在hdfs上创建文件

复制代码
hdfs dfs -mkdir /demo

一开始出现了如下错误

解决方法如下

复制代码
cd /etc
vi hosts

再重新启动

复制代码
stop-all.sh
start-all.sh

然后解决问题


我们发现没有datanode

删除hadoop/tmp时可以使用

复制代码
rm -rm tmp


Linux(CentOS7)下安装idea的详细步骤_centos7.9安装idea社区版本-CSDN博客

参考以上教程

相关推荐
一瓢西湖水7 小时前
列式数据库-以clickHouse为例
数据库·clickhouse
Elastic 中国社区官方博客7 小时前
使用 Elastic Cloud Serverless 扩展批量索引
大数据·运维·数据库·elasticsearch·搜索引擎·云原生·serverless
liulanba7 小时前
AI Agent技术完整指南 第一部分:基础理论
数据库·人工智能·oracle
没有bug.的程序员7 小时前
服务安全:内部服务如何防止“裸奔”?
java·网络安全·云原生安全·服务安全·零信任架构·微服务安全·内部鉴权
逆天小北鼻7 小时前
Oracle 服务端与客户端的核心区分要点
数据库·oracle
2501_946242937 小时前
MPV-EASY Player (MPV播放器) v0.41.0.1
数据库·经验分享·云计算·计算机外设·github·电脑·csdn开发云
一线大码8 小时前
SpringBoot 3 和 4 的版本新特性和升级要点
java·spring boot·后端
weixin_440730508 小时前
java数组整理笔记
java·开发语言·笔记
weixin_425023008 小时前
Spring Boot 实用核心技巧汇总:日期格式化、线程管控、MCP服务、AOP进阶等
java·spring boot·后端
一线大码8 小时前
Java 8-25 各个版本新特性总结
java·后端