hadoop分布式文件系统常用命令

前言

搭建完hadoop后,会生成一个hdfs的分布式文件系统。HDFS是一个逻辑上的文件系统,它存储在Hadoop集群的多个节点上,而不是单个机器的本地磁盘上。

常用命令

复制代码
# 创建目录,-p参数可以创建所有必需的父目录(按照层级)
hdfs dfs -mkdir -p /user/tmp

# 删除制定目录,-r参数用于递归删除目录及其内容
hdfs dfs -rm -r /user/

# 复制目录或者文件
hdfs dfs -cp /user/tmp/ /home/tmp/

# 移动目录或者文件
hdfs dfs -mv /user/tmp/ /home/tmp/

# 列出根目录下的所有内容,文件权限、所有者、大小等信息
hdfs dfs -ls /

# 更改文件权限
hdfs dfs -chmod 777 /user/tmp

# 创建一个文件
hdfs dfs -touchz tmp

​ 以上所有命令操作,都不会影响Linux本地文件系统里的文件,因为它是基于hdfs分布式文件系统进行的,相当于基于Linux磁盘存储又虚拟了一套逻辑存储系统,和Linux 本地文件系统是完全相互独立的。

和Linux 本地文件系统区别

1 完全独立的两套文件系统,各自系统创建文件完全独立,互不影响

2 访问方式不同,(访问命令类似)

3 权限和安全性:HDFS的权限模型与本地文件系统类似,但它们是独立的。在HDFS中设置的权限不会影响本地文件系统的权限,反之亦然。

经验总结

1 这些知识在大数据学习中应该算是基础中的基础了,理解不了这些,在部署大数据相关组件时,会遇到非常大的坑;

2 区别记住一句话,相互独立,命令相似;

相关推荐
码农水水8 小时前
国家电网Java面试被问:TCP的BBR拥塞控制算法原理
java·开发语言·网络·分布式·面试·wpf
InterestOriented8 小时前
破解银发学习痛点 兴趣岛 “普惠 + 品质” 模式打造积极老龄化范本
大数据·人工智能·学习
pingao14137810 小时前
太阳总辐射传感器:能源、气象领域的关键测量工具
大数据·能源
百***787511 小时前
Grok-4.1技术深度解析:双版本架构突破与Python API快速集成指南
大数据·python·架构
码农水水11 小时前
京东Java面试被问:HTTP/2的多路复用和头部压缩实现
java·开发语言·分布式·http·面试·php·wpf
Francek Chen13 小时前
【大数据基础】大数据处理架构Hadoop:01 Hadoop概述
大数据·hadoop·分布式·架构
互联网科技看点13 小时前
诸葛io获认可:金融分析智能体赛道领航者
大数据·人工智能·金融
2301_8002561114 小时前
全球气候与环境变化考试知识点梳理(1)
大数据·人工智能
edisao14 小时前
六、 读者高频疑问解答 & 架构价值延伸
大数据·开发语言·人工智能·科技·架构·php
-大头.14 小时前
GIT教程系列(共3篇)---------第二篇:Git高级协作与团队实战完全指南
大数据·git·elasticsearch