目录

hadoop分布式文件系统常用命令

前言

搭建完hadoop后,会生成一个hdfs的分布式文件系统。HDFS是一个逻辑上的文件系统,它存储在Hadoop集群的多个节点上,而不是单个机器的本地磁盘上。

常用命令

复制代码
# 创建目录,-p参数可以创建所有必需的父目录(按照层级)
hdfs dfs -mkdir -p /user/tmp

# 删除制定目录,-r参数用于递归删除目录及其内容
hdfs dfs -rm -r /user/

# 复制目录或者文件
hdfs dfs -cp /user/tmp/ /home/tmp/

# 移动目录或者文件
hdfs dfs -mv /user/tmp/ /home/tmp/

# 列出根目录下的所有内容,文件权限、所有者、大小等信息
hdfs dfs -ls /

# 更改文件权限
hdfs dfs -chmod 777 /user/tmp

# 创建一个文件
hdfs dfs -touchz tmp

​ 以上所有命令操作,都不会影响Linux本地文件系统里的文件,因为它是基于hdfs分布式文件系统进行的,相当于基于Linux磁盘存储又虚拟了一套逻辑存储系统,和Linux 本地文件系统是完全相互独立的。

和Linux 本地文件系统区别

1 完全独立的两套文件系统,各自系统创建文件完全独立,互不影响

2 访问方式不同,(访问命令类似)

3 权限和安全性:HDFS的权限模型与本地文件系统类似,但它们是独立的。在HDFS中设置的权限不会影响本地文件系统的权限,反之亦然。

经验总结

1 这些知识在大数据学习中应该算是基础中的基础了,理解不了这些,在部署大数据相关组件时,会遇到非常大的坑;

2 区别记住一句话,相互独立,命令相似;

本文是转载文章,点击查看原文
如有侵权,请联系 xyy@jishuzhan.net 删除
相关推荐
CopyLower3 小时前
分布式ID生成方案的深度解析与Java实现
java·开发语言·分布式
ml130185288746 小时前
开发一个环保回收小程序需要哪些功能?环保回收小程序
java·大数据·微信小程序·小程序·开源软件
Charlie__ZS7 小时前
SpringCloud - 分布式事务
分布式·spring·spring cloud
zybishe7 小时前
免费送源码:Java+ssm+MySQL 酒店预订管理系统的设计与实现 计算机毕业设计原创定制
java·大数据·python·mysql·微信小程序·php·课程设计
lauo9 小时前
智体知识库:ai-docs对分布式智体编程语言Poplang和javascript的语法的比较(知识库问答)
开发语言·前端·javascript·分布式·机器人·开源
塔能物联运维9 小时前
塔能科技解节能密码,工厂成本“效益方程式”精准破题
大数据·人工智能
Lilith的AI学习日记11 小时前
MetaGPT深度解析:重塑AI协作开发的智能体框架实践指南
大数据·人工智能·机器学习·aigc
JKIT沐枫12 小时前
PHP如何能获取网站上返回的数组指南
android·大数据
鸿乃江边鸟13 小时前
Starrocks的Bitmap索引和Bloom filter索引以及全局字典
大数据·starrocks·sql
Hadoop_Liang13 小时前
openEuler24.03 LTS下安装Spark
大数据·分布式·spark·openeuler