hadoop分布式文件系统常用命令

前言

搭建完hadoop后,会生成一个hdfs的分布式文件系统。HDFS是一个逻辑上的文件系统,它存储在Hadoop集群的多个节点上,而不是单个机器的本地磁盘上。

常用命令

复制代码
# 创建目录,-p参数可以创建所有必需的父目录(按照层级)
hdfs dfs -mkdir -p /user/tmp

# 删除制定目录,-r参数用于递归删除目录及其内容
hdfs dfs -rm -r /user/

# 复制目录或者文件
hdfs dfs -cp /user/tmp/ /home/tmp/

# 移动目录或者文件
hdfs dfs -mv /user/tmp/ /home/tmp/

# 列出根目录下的所有内容,文件权限、所有者、大小等信息
hdfs dfs -ls /

# 更改文件权限
hdfs dfs -chmod 777 /user/tmp

# 创建一个文件
hdfs dfs -touchz tmp

​ 以上所有命令操作,都不会影响Linux本地文件系统里的文件,因为它是基于hdfs分布式文件系统进行的,相当于基于Linux磁盘存储又虚拟了一套逻辑存储系统,和Linux 本地文件系统是完全相互独立的。

和Linux 本地文件系统区别

1 完全独立的两套文件系统,各自系统创建文件完全独立,互不影响

2 访问方式不同,(访问命令类似)

3 权限和安全性:HDFS的权限模型与本地文件系统类似,但它们是独立的。在HDFS中设置的权限不会影响本地文件系统的权限,反之亦然。

经验总结

1 这些知识在大数据学习中应该算是基础中的基础了,理解不了这些,在部署大数据相关组件时,会遇到非常大的坑;

2 区别记住一句话,相互独立,命令相似;

相关推荐
寻道模式4 分钟前
【时间之外】私有化部署AI的3个优点和3个缺点
大数据·人工智能·ollama·私有化·genericagent
郑寿昌7 分钟前
2026脑机接口与大模型融合架构解析
大数据·人工智能·架构
涤生大数据11 分钟前
大数据面试高频题:row_number() 数据倾斜到底怎么解决?
java·大数据·面试
lizhihai_9916 分钟前
股市学习心得-技术指标学习(布林线+MACD)
大数据·人工智能·学习
胡耀超21 分钟前
《设计数据密集型应用》(DDIA, 2nd ed.) 心智模型导览——《Designing Data-Intensive Applications》书介绍导航
大数据·数据库·分布式·ai·架构·数据
一个数据大开发28 分钟前
数据中台架构中本体驱动的语义治理实践
大数据·架构
夏贰四29 分钟前
数据库管理有哪些核心要点?数据库管理该如何规范落地?
大数据·数据库·数据库管理·数据库管理员
石逸凡35 分钟前
论组织本源与钻形式招牌的空子
大数据·组合模式
千桐科技36 分钟前
qData 数据中台开源版v1.5.2 正式发布!重构建模流程,完善全域数据资产治理体系
大数据·开源·#开源项目·# 数据中台·#中小企业数字化·#数据治理·#数字化转型
Elastic 中国社区官方博客1 小时前
一个查询,无限 Elasticsearch Serverless 项目:跨项目搜索介绍
大数据·elasticsearch·搜索引擎·信息可视化·云原生·serverless·全文检索