hadoop shell操作 hdfs处理文件命令 hdfs上传命令 hadoop fs -put命令hadoop fs相关命令 hadoop(十三)

hadoop fs -help rm 查看rm命令作用

hadoop fs 查看命令

  1. 创建文件夹:

    hdfs前缀也是可以的。更推荐hadoop

    hadoop fs -mkdir /sanguo

2.上传至hdfs命令:

作用: 从本地上传hdfs系统 (本地文件被剪切走,不存在了)

命令:

bash 复制代码
# 新建文件
vi shuguo.txt
#进入后 输入一些文字,保存退出即可

#同shuguo.txt要在同目录下,输入命令
hadoop fs -moveFromLocal shuguo.txt /sanguo
  1. 拷贝文件上传到hdfs系统:
bash 复制代码
#新增文件
vi weiguo.txt
# 输入一些文字,保存并退出
 
# 从本地复制一份文件,至hdfs文件系统
hadoop fs -copyFromLocal weiguo.txt /sanguo


# 同上相同,更推荐这种,更加简洁
hadoop fs -put weiguo.txt /sanguo
  1. 追加文件内容:
bash 复制代码
# 新建文件
vi liubei.txt
# 输入一些文字,保存并退出

# 
hadoop fs -appendToFile liubei.txt /sanguo/shuguo.txt

  1. 从hdfs下载至本地:
bash 复制代码
# copy
hadoop fs -copyToLocal /sanguo/shuguo.txt ./


# 更推荐这种,简洁
# 下载
hadoop fs -get /sanguo/shuguo.txt ./
  1. ls命令:
bash 复制代码
hadoop fs -ls /sanguo
  1. cat命令:
bash 复制代码
hadoop fs -cat /sanguo/shuguo.txt

8.更改权限:

bash 复制代码
hadoop fs -chown hadoop:hadoop /sanguo/shuguo.txt
  1. cp 复制:
bash 复制代码
# 创建文件夹
hadoop fs -mkdir /jinguo
# 复制
hadoop fs -cp /sanguo/shuguo.txt /jinguo
  1. mv 移动:
bash 复制代码
hadoop fs -mv /sanguo/weiguo.txt /jinguo
  1. tail 查看
bash 复制代码
hadoop fs -tail /sanguo/shuguo.txt
  1. 删除文件或文件夹
bash 复制代码
# 删除文件
hadoop fs -rm /sanguo/shuguo.txt

# 递归删除文件夹
hadoop fs -rm -r /sanguo
  1. 统计文件夹大小信息:
bash 复制代码
hadoop fs -du -s -h /sanguo

27 文件大小, 81 副本*文件大小

下面是查看文件夹每个文件的统计信息

bash 复制代码
hadoop fs -du  -h /sanguo
  1. 设置副本数量:
bash 复制代码
hadoop fs -setrep 2 /sanguo/shuguo.txt

副本数量记录在NameNode,不要设置超过节点数量的副本,设置超过节点数,最多也只是总节点数量的副本,不会超过DataNode节点数, 如果设置8个副本,如果DataNode节点数有8个,才会有8个副本

总结:命令太多不一一列举了,同centos系统一样,只是前面加了hadoop fs, 很容易记住

相关推荐
onebound_noah1 小时前
电商图片搜索:技术破局与商业落地,重构“视觉到交易”全链路
大数据·前端·网络·人工智能·重构·php
n***63273 小时前
Python大数据可视化:基于大数据技术的共享单车数据分析与辅助管理系统_flask+hadoop+spider
大数据·python·信息可视化
Michelle80233 小时前
24大数据 while循环
大数据·python
Hello.Reader4 小时前
从 CDC 到实时数据流Flink SQLServer CDC Connector 实战
大数据·sqlserver·flink
TG:@yunlaoda360 云老大6 小时前
谷歌云Flink 核心组成及生态发展:实时数据处理的下一代引擎
大数据·flink·googlecloud
JavaBoy_XJ6 小时前
电商系统中ES检索技术设计和运用
大数据·elasticsearch·搜索引擎
nini_boom14 小时前
**论文初稿撰写工具2025推荐,高效写作与智能辅助全解析*
大数据·python·信息可视化
小园子的小菜14 小时前
Elasticsearch高阶用法实战:从数据建模到集群管控的极致优化
大数据·elasticsearch·搜索引擎
源码之家16 小时前
机器学习:基于大数据二手房房价预测与分析系统 可视化 线性回归预测算法 Django框架 链家网站 二手房 计算机毕业设计✅
大数据·算法·机器学习·数据分析·spark·线性回归·推荐算法
干就完事了16 小时前
Hive内置函数
数据仓库·hive·hadoop