hadoop shell操作 hdfs处理文件命令 hdfs上传命令 hadoop fs -put命令hadoop fs相关命令 hadoop(十三)

hadoop fs -help rm 查看rm命令作用

hadoop fs 查看命令

  1. 创建文件夹:

    hdfs前缀也是可以的。更推荐hadoop

    hadoop fs -mkdir /sanguo

2.上传至hdfs命令:

作用: 从本地上传hdfs系统 (本地文件被剪切走,不存在了)

命令:

bash 复制代码
# 新建文件
vi shuguo.txt
#进入后 输入一些文字,保存退出即可

#同shuguo.txt要在同目录下,输入命令
hadoop fs -moveFromLocal shuguo.txt /sanguo
  1. 拷贝文件上传到hdfs系统:
bash 复制代码
#新增文件
vi weiguo.txt
# 输入一些文字,保存并退出
 
# 从本地复制一份文件,至hdfs文件系统
hadoop fs -copyFromLocal weiguo.txt /sanguo


# 同上相同,更推荐这种,更加简洁
hadoop fs -put weiguo.txt /sanguo
  1. 追加文件内容:
bash 复制代码
# 新建文件
vi liubei.txt
# 输入一些文字,保存并退出

# 
hadoop fs -appendToFile liubei.txt /sanguo/shuguo.txt

  1. 从hdfs下载至本地:
bash 复制代码
# copy
hadoop fs -copyToLocal /sanguo/shuguo.txt ./


# 更推荐这种,简洁
# 下载
hadoop fs -get /sanguo/shuguo.txt ./
  1. ls命令:
bash 复制代码
hadoop fs -ls /sanguo
  1. cat命令:
bash 复制代码
hadoop fs -cat /sanguo/shuguo.txt

8.更改权限:

bash 复制代码
hadoop fs -chown hadoop:hadoop /sanguo/shuguo.txt
  1. cp 复制:
bash 复制代码
# 创建文件夹
hadoop fs -mkdir /jinguo
# 复制
hadoop fs -cp /sanguo/shuguo.txt /jinguo
  1. mv 移动:
bash 复制代码
hadoop fs -mv /sanguo/weiguo.txt /jinguo
  1. tail 查看
bash 复制代码
hadoop fs -tail /sanguo/shuguo.txt
  1. 删除文件或文件夹
bash 复制代码
# 删除文件
hadoop fs -rm /sanguo/shuguo.txt

# 递归删除文件夹
hadoop fs -rm -r /sanguo
  1. 统计文件夹大小信息:
bash 复制代码
hadoop fs -du -s -h /sanguo

27 文件大小, 81 副本*文件大小

下面是查看文件夹每个文件的统计信息

bash 复制代码
hadoop fs -du  -h /sanguo
  1. 设置副本数量:
bash 复制代码
hadoop fs -setrep 2 /sanguo/shuguo.txt

副本数量记录在NameNode,不要设置超过节点数量的副本,设置超过节点数,最多也只是总节点数量的副本,不会超过DataNode节点数, 如果设置8个副本,如果DataNode节点数有8个,才会有8个副本

总结:命令太多不一一列举了,同centos系统一样,只是前面加了hadoop fs, 很容易记住

相关推荐
Elastic 中国社区官方博客14 分钟前
Elasticsearch 混合搜索 - Hybrid Search
大数据·人工智能·elasticsearch·搜索引擎·ai·语言模型·全文检索
{⌐■_■}20 分钟前
【git】工作场景下的 工作区 <-> 暂存区<-> 本地仓库 命令实战 具体案例
大数据·git·elasticsearch·golang·iphone·ip·etcd
码界筑梦坊1 小时前
基于Flask的京东商品信息可视化分析系统的设计与实现
大数据·python·信息可视化·flask·毕业设计
专注API从业者4 小时前
分布式电商系统中的API网关架构设计
大数据·数据仓库·分布式·架构
viperrrrrrrrrr76 小时前
大数据学习(49) - Flink按键分区状态(Keyed State)
大数据·学习·flink
狮歌~资深攻城狮7 小时前
未来已来:HBase的新功能与发展趋势展望
大数据·wpf·hbase
我要用代码向我喜欢的女孩表白7 小时前
hive迁移补数脚本细粒度 表名-分区唯一键
数据仓库·hive·hadoop
weixin_307779137 小时前
PySpark实现MERGE INTO的数据合并功能
大数据·python·spark
隔壁老登7 小时前
查询hive指定数据库下所有表的建表语句并生成数据字典
数据库·hive·hadoop
vx1530278236211 小时前
CDGA|企业数据治理实战:从疏通“信息河”到打造优质“数据湖”
java·大数据·人工智能·cdga·数据治理