Hadoop3:HDFS的Shell操作(常用命令汇总)

一、简介

什么是HDFSShell操作?

很简单,就是在Linux的终端,通过命令来操作HDFS

如果,你们学习过git、docker、k8s,应该会发现,这些命令的特点和shell命令非常相似

二、常用命令

1、准备工作相关命令

启动集群

bash 复制代码
sbin/start-dfs.sh
sbin/start-yarn.sh

查看命令帮助

bash 复制代码
hadoop fs -help rm

创建/sanguo文件夹

bash 复制代码
hadoop fs -mkdir /sanguo

2、上传

1、-moveFromLocal:从本地剪切粘贴到HDFS

bash 复制代码
hadoop fs -moveFromLocal ./shuguo.txt /sanguo

2、-copyFromLocal:从本地拷贝文件到HDFS指定路径中

bash 复制代码
hadoop fs -copyFromLocal ./weiguo.txt /sanguo

3、-put:等同于 copyFromLocal,生产环境更习惯用 put

bash 复制代码
hadoop fs -put ./wuguo.txt /sanguo

4、-appendToFile:追加一个文件中的内容HDFS中已经存在的文件末尾

bash 复制代码
hadoop fs -appendToFile liubei.txt /sanguo/shuguo.txt

注意

此命令可能遇到的错误

解决办法

hdfs-site.xml文件中添加如下配置,重启Hadoop集群即可

xml 复制代码
  <property>
       <name>dfs.client.block.write.replace-datanode-on-failure.policy</name>
       <value>NEVER</value>
  </property>

参考:Hadoop的append命令报错的解决办法

3、下载

1、-copyToLocal:从HDFS拷贝到本地

bash 复制代码
hadoop fs -copyToLocal /sanguo/shuguo.txt ./

2、-get:等同于 copyToLocal,生产环境更习惯用 get

bash 复制代码
hadoop fs -get /sanguo/shuguo.txt ./shuguo2.txt

4、文件的常用操作

1、-ls: 显示目录信息

bash 复制代码
hadoop fs -ls /sanguo

2、-cat:显示文件内容

bash 复制代码
hadoop fs -cat /sanguo/shuguo.txt

3、-chgrp、 -chmod、 -chown :同Linux文件系统中的用法一样,修改文件所属权限

bash 复制代码
hadoop fs -chmod 777 /sanguo/shuguo.txt

4、-mkdir:创建路径

bash 复制代码
hadoop fs -mkdir /jinguo

5、-cp:从HDFS的一个路径拷贝HDFS的另一个路径

bash 复制代码
hadoop fs -cp /sanguo/shuguo.txt /jinguo

6、-mv:在HDFS目录中移动(剪切)文件

bash 复制代码
hadoop fs -mv /sanguo/weiguo.txt /jinguo

7、-tail:显示一个文件的末尾1kb的数据

bash 复制代码
hadoop fs -tail /jinguo/shuguo.txt

8、-rm:删除文件或文件夹

bash 复制代码
hadoop fs -rm /sanguo/shuguo.txt

9、-rm -r 递归删除目录及目录里面的文件

bash 复制代码
hadoop fs -rm -r /sanguo

10、-du统计文件夹的大小信息

bash 复制代码
hadoop fs -du -s -h /jinguo
hadoop fs -du -h /jinguo

说明: 27表示一个节点上文件大小;81表示27*3个副本的总大小;/jinguo表示查看的目录

11、-setrep:设置HDFS中文件的副本数量

bash 复制代码
hadoop fs -setrep 10 /jinguo/shuguo.txt

这里设置的副本数只是记录在NameNode元数据中,是否真的会有这么多副本,还得看DataNode的数量。因为目前只有 3台 设备,最多也就 3个 副本,只有节点数的增加到10台时副本数才能达到10个,当然,节点数超过10个,副本数也只能是10个。

相关推荐
wanhengidc1 分钟前
云手机 数据信息资源共享
大数据·运维·服务器·游戏·智能手机
Oscar的参数30 分钟前
datagrip连接未预置数据库保姆级教程--以dm数据库为例
大数据·数据库·database
babe小鑫44 分钟前
2026高职大数据技术专业学习数据分析的指南
大数据·学习·数据分析
天远云服1 小时前
PHP微服务风控架构:无缝接入天远劳动仲裁信息查询API排查用工黑产
大数据·微服务·架构·php
zhangkaixuan4561 小时前
Paimon 数据湖 + Gravitino 元数据中心:技术原理与实战指南
大数据·flink·paimon·gravitino·datalake
失败才是人生常态1 小时前
大数据基础学习
大数据·学习
北京软秦科技有限公司1 小时前
IACheck AI报告文档审核:高端制造标准引用报告审核的智能导航
大数据·人工智能·制造
中烟创新2 小时前
技术深耕,全域赋能:中烟创新产品矩阵与OpenClaw实现深度融合
大数据·人工智能
QYR_Jodie2 小时前
稳健增速托举刚需扩容:全球X射线荧光光谱仪(XRF)2026-2032年CAGR4.8%,2032年剑指11.73亿美元
大数据·人工智能·市场报告
昨夜见军贴06162 小时前
IACheck AI报告文档审核助力新能源汽车:降低电磁兼容(EMC)检测报告风险,确保合规性与准确性
大数据·人工智能·汽车