hadoop:hafs:上传文件、删除文件、改变文件权限等常用命令

Hadoop是一个开源的分布式计算框架,用于处理和分析大数据集。Hadoop提供了大量的命令来管理集群、处理数据以及执行其他相关任务。

🍀以下是一些常用的Hadoop命令的汇总:

1 启动和关闭Hadoop服务

启动所有Hadoop服务

bash 复制代码
start-all.sh

关闭所有Hadoop服务

bash 复制代码
stop-all.sh

2 HDFS文件系统命令

上传文件到HDFS

bash 复制代码
hdfs dfs -put <local_src> <hdfs_dst>

查看文件系统根目录的文件夹

bash 复制代码
hdfs dfs -ls /

显示Hadoop上的文件内容

bash 复制代码
hdfs dfs -cat <hdfs_file>

从Hadoop上获取文件到本地

bash 复制代码
hdfs dfs -get <hdfs_src> <local_dst>

在Hadoop上删除文件

bash 复制代码
hdfs dfs -rm <hdfs_file>

在Hadoop上创建目录

bash 复制代码
hdfs dfs -mkdir <hdfs_dir>

在Hadoop上创建多级目录

bash 复制代码
hdfs dfs -mkdir -p <hdfs_dir_with_subdirs>

删除目录

bash 复制代码
hdfs dfs -rm -r <hdfs_dir>

重命名文件

bash 复制代码
hdfs dfs -mv <hdfs_src> <hdfs_dst>

3 权限管理类

改变文件所属组

bash 复制代码
hdfs dfs -chgrp <group> <path>

改变文件权限

bash 复制代码
hdfs dfs -chmod [-R] <permissions> <path>
相关推荐
TDengine (老段)2 小时前
TDengine 使用最佳实践(2)
大数据·数据库·物联网·时序数据库·iot·tdengine·涛思数据
Deng9452013143 小时前
基于大数据的电力系统故障诊断技术研究
大数据·matplotlib·深度特征提取·随机森林分类算法·标签编码
C182981825754 小时前
分布式ID 与自增区别
分布式
小菜鸡06266 小时前
FlinkSQL通解
大数据·flink
寅鸷6 小时前
es里为什么node和shard不是一对一的关系
大数据·elasticsearch
码字的字节8 小时前
深入解析Hadoop RPC:技术细节与推广应用
hadoop·rpc
码字的字节8 小时前
深入解析Hadoop架构设计:原理、组件与应用
大数据·hadoop·分布式·hadoop架构设计
阿里云大数据AI技术10 小时前
云上AI推理平台全掌握 (3):服务接入与全球调度
大数据·人工智能·深度学习
时序数据说11 小时前
如何选择时序数据库:关键因素与实用指南
大数据·数据库·物联网·时序数据库·iotdb
金牌服务刘11 小时前
选择一个系统作为主数据源的优势与考量
大数据·数据分析·连续集成