HDFS EXERCISES

复制代码
bash: hdfs: command not found...

这可能是因为hdfs命令不在系统环境变量中

复制代码
whereis hadoop

找到hadoop的位置

一旦找到Hadoop安装目录,您需要将其 bin 目录添加到PATH环境变量中。

复制代码
vi ~/.bashrc

.bashrc 是一个在Linux和Unix系统中用于Bash shell的配置文件。当你启动一个新的终端会话时,或者在命令行中启动一个新的Bash实例时,该文件会被自动读取并执行。文件中包含的命令用于配置终端会话的环境变量,别名,以及自定义命令。

是改变生效

复制代码
source ~/.bashrc

复制代码
bash: start-dfs.sh: command not found...

这通常意味着 Hadoop 的 sbin 目录 没有被添加到环境变量 PATH 中。

同上解决

$

在 Bash 和其他类 Unix 操作系统的 shell 中,$ 符号用于访问变量的值。当你在命令行或者脚本中使用 $ 符号,它告诉 shell 去获取与紧随其后的文字对应的变量的值。

当你定义了一个变量,比如 MY_VARIABLE=hello,你可以通过 $MY_VARIABLE 来访问它的值。例如,echo $MY_VARIABLE 会输出 hello

修改完之后就可以全局启动hdfs

复制代码
start-dfs.sh

查看状态我们可以发现没有datanode

我们可以手动启动datanode

复制代码
hadoop-daemon.sh start datanode

查看UI界面

先关闭防火墙

复制代码
systemctl stop firewalld    #关闭防火墙

systemctl disable firlewalld  #关闭防火墙开机启动

访问

复制代码
http://localhost:50070

在hdfs上创建文件

复制代码
hdfs dfs -mkdir /demo

一开始出现了如下错误

解决方法如下

复制代码
cd /etc
vi hosts

再重新启动

复制代码
stop-all.sh
start-all.sh

然后解决问题


我们发现没有datanode

删除hadoop/tmp时可以使用

复制代码
rm -rm tmp


Linux(CentOS7)下安装idea的详细步骤_centos7.9安装idea社区版本-CSDN博客

参考以上教程

相关推荐
Leo.yuan12 分钟前
不同数据仓库模型有什么不同?企业如何选择适合的数据仓库模型?
大数据·数据库·数据仓库·信息可视化·spark
麦兜*29 分钟前
MongoDB 6.0 新特性解读:时间序列集合与加密查询
数据库·spring boot·mongodb·spring·spring cloud·系统架构
chat2tomorrow32 分钟前
数据采集平台的起源与演进:从ETL到数据复制
大数据·数据库·数据仓库·mysql·低代码·postgresql·etl
a5876932 分钟前
消息队列(MQ)初级入门:详解RabbitMQ与Kafka
java·分布式·microsoft·面试·kafka·rabbitmq
稻草人想看远方35 分钟前
关系型数据库和非关系型数据库
数据库
考虑考虑35 分钟前
Postgerssql格式化时间
数据库·后端·postgresql
千里码aicood44 分钟前
【springboot+vue】党员党建活动管理平台(源码+文档+调试+基础修改+答疑)
java·数据库·spring boot
Chan161 小时前
【智能协同云图库】基于统一接口架构构建多维度分析功能、结合 ECharts 可视化与权限校验实现用户 / 管理员图库统计、通过 SQL 优化与流式处理提升数据
java·spring boot·后端·sql·spring·intellij-idea·echarts
先做个垃圾出来………1 小时前
差分数组(Difference Array)
java·数据结构·算法
TDengine (老段)1 小时前
TDengine 选择函数 Max() 用户手册
大数据·数据库·物联网·时序数据库·tdengine·涛思数据