hadoop shell操作 hdfs处理文件命令 hdfs上传命令 hadoop fs -put命令hadoop fs相关命令 hadoop(十三)

hadoop fs -help rm 查看rm命令作用

hadoop fs 查看命令

  1. 创建文件夹:

    hdfs前缀也是可以的。更推荐hadoop

    hadoop fs -mkdir /sanguo

2.上传至hdfs命令:

作用: 从本地上传hdfs系统 (本地文件被剪切走,不存在了)

命令:

bash 复制代码
# 新建文件
vi shuguo.txt
#进入后 输入一些文字,保存退出即可

#同shuguo.txt要在同目录下,输入命令
hadoop fs -moveFromLocal shuguo.txt /sanguo
  1. 拷贝文件上传到hdfs系统:
bash 复制代码
#新增文件
vi weiguo.txt
# 输入一些文字,保存并退出
 
# 从本地复制一份文件,至hdfs文件系统
hadoop fs -copyFromLocal weiguo.txt /sanguo


# 同上相同,更推荐这种,更加简洁
hadoop fs -put weiguo.txt /sanguo
  1. 追加文件内容:
bash 复制代码
# 新建文件
vi liubei.txt
# 输入一些文字,保存并退出

# 
hadoop fs -appendToFile liubei.txt /sanguo/shuguo.txt

  1. 从hdfs下载至本地:
bash 复制代码
# copy
hadoop fs -copyToLocal /sanguo/shuguo.txt ./


# 更推荐这种,简洁
# 下载
hadoop fs -get /sanguo/shuguo.txt ./
  1. ls命令:
bash 复制代码
hadoop fs -ls /sanguo
  1. cat命令:
bash 复制代码
hadoop fs -cat /sanguo/shuguo.txt

8.更改权限:

bash 复制代码
hadoop fs -chown hadoop:hadoop /sanguo/shuguo.txt
  1. cp 复制:
bash 复制代码
# 创建文件夹
hadoop fs -mkdir /jinguo
# 复制
hadoop fs -cp /sanguo/shuguo.txt /jinguo
  1. mv 移动:
bash 复制代码
hadoop fs -mv /sanguo/weiguo.txt /jinguo
  1. tail 查看
bash 复制代码
hadoop fs -tail /sanguo/shuguo.txt
  1. 删除文件或文件夹
bash 复制代码
# 删除文件
hadoop fs -rm /sanguo/shuguo.txt

# 递归删除文件夹
hadoop fs -rm -r /sanguo
  1. 统计文件夹大小信息:
bash 复制代码
hadoop fs -du -s -h /sanguo

27 文件大小, 81 副本*文件大小

下面是查看文件夹每个文件的统计信息

bash 复制代码
hadoop fs -du  -h /sanguo
  1. 设置副本数量:
bash 复制代码
hadoop fs -setrep 2 /sanguo/shuguo.txt

副本数量记录在NameNode,不要设置超过节点数量的副本,设置超过节点数,最多也只是总节点数量的副本,不会超过DataNode节点数, 如果设置8个副本,如果DataNode节点数有8个,才会有8个副本

总结:命令太多不一一列举了,同centos系统一样,只是前面加了hadoop fs, 很容易记住

相关推荐
Dreams°1231 小时前
大数据 ETL + Flume 数据清洗 — 详细教程及实例(附常见问题及解决方案)
大数据·单元测试·可用性测试
sf_www1 小时前
Flink on YARN是如何确定TaskManager个数的
大数据·flink
武子康2 小时前
大数据-213 数据挖掘 机器学习理论 - KMeans Python 实现 距离计算函数 质心函数 聚类函数
大数据·人工智能·python·机器学习·数据挖掘·scikit-learn·kmeans
武子康2 小时前
大数据-214 数据挖掘 机器学习理论 - KMeans Python 实现 算法验证 sklearn n_clusters labels
大数据·人工智能·python·深度学习·算法·机器学习·数据挖掘
Aloudata3 小时前
NoETL自动化指标平台为数据分析提质增效,驱动业务决策
大数据·数据分析·指标平台·指标体系
2401_883041087 小时前
新锐品牌电商代运营公司都有哪些?
大数据·人工智能
青云交7 小时前
大数据新视界 -- 大数据大厂之 Impala 性能优化:融合机器学习的未来之路(上 (2-1))(11/30)
大数据·计算资源·应用案例·数据交互·impala 性能优化·机器学习融合·行业拓展
Json_1817901448010 小时前
An In-depth Look into the 1688 Product Details Data API Interface
大数据·json
Qspace丨轻空间12 小时前
气膜场馆:推动体育文化旅游创新发展的关键力量—轻空间
大数据·人工智能·安全·生活·娱乐
Elastic 中国社区官方博客13 小时前
如何将数据从 AWS S3 导入到 Elastic Cloud - 第 3 部分:Elastic S3 连接器
大数据·elasticsearch·搜索引擎·云计算·全文检索·可用性测试·aws