hadoop分布式文件系统常用命令

前言

搭建完hadoop后,会生成一个hdfs的分布式文件系统。HDFS是一个逻辑上的文件系统,它存储在Hadoop集群的多个节点上,而不是单个机器的本地磁盘上。

常用命令

复制代码
# 创建目录,-p参数可以创建所有必需的父目录(按照层级)
hdfs dfs -mkdir -p /user/tmp

# 删除制定目录,-r参数用于递归删除目录及其内容
hdfs dfs -rm -r /user/

# 复制目录或者文件
hdfs dfs -cp /user/tmp/ /home/tmp/

# 移动目录或者文件
hdfs dfs -mv /user/tmp/ /home/tmp/

# 列出根目录下的所有内容,文件权限、所有者、大小等信息
hdfs dfs -ls /

# 更改文件权限
hdfs dfs -chmod 777 /user/tmp

# 创建一个文件
hdfs dfs -touchz tmp

​ 以上所有命令操作,都不会影响Linux本地文件系统里的文件,因为它是基于hdfs分布式文件系统进行的,相当于基于Linux磁盘存储又虚拟了一套逻辑存储系统,和Linux 本地文件系统是完全相互独立的。

和Linux 本地文件系统区别

1 完全独立的两套文件系统,各自系统创建文件完全独立,互不影响

2 访问方式不同,(访问命令类似)

3 权限和安全性:HDFS的权限模型与本地文件系统类似,但它们是独立的。在HDFS中设置的权限不会影响本地文件系统的权限,反之亦然。

经验总结

1 这些知识在大数据学习中应该算是基础中的基础了,理解不了这些,在部署大数据相关组件时,会遇到非常大的坑;

2 区别记住一句话,相互独立,命令相似;

相关推荐
计算机毕设定制辅导-无忧学长42 分钟前
RabbitMQ 快速上手:安装配置与 HelloWorld 实践(二)
分布式·rabbitmq·ruby
杰克逊的日记1 小时前
Flink运维要点
大数据·运维·flink
啾啾Fun1 小时前
【Java微服务组件】分布式协调P1-数据共享中心简单设计与实现
java·分布式·微服务
hnlucky2 小时前
Windows 上安装下载并配置 Apache Maven
java·hadoop·windows·学习·maven·apache
梦想画家4 小时前
Scrapy进阶实践指南:从脚本运行到分布式爬取
分布式·scrapy·数据工程
markuszhang4 小时前
Elasticsearch 官网阅读之 Term-level Queries
大数据·elasticsearch·搜索引擎
东阳马生架构5 小时前
Seata源码—5.全局事务的创建与返回处理二
分布式·seata·分布式事务
Hello World......6 小时前
Java求职面试:从核心技术到大数据与AI的场景应用
大数据·java面试·技术栈·互联网大厂·ai服务
掘金-我是哪吒6 小时前
分布式微服务系统架构第133集:运维服务器6年经验,高并发,大数据量系统
运维·服务器·分布式·微服务·系统架构
python算法(魔法师版)7 小时前
.NET NativeAOT 指南
java·大数据·linux·jvm·.net