Hadoop是一个开源的分布式计算框架,用于处理和分析大数据集。Hadoop提供了大量的命令来管理集群、处理数据以及执行其他相关任务。
🍀以下是一些常用的Hadoop命令的汇总:
1 启动和关闭Hadoop服务
启动所有Hadoop服务
bashstart-all.sh
关闭所有Hadoop服务
bashstop-all.sh
2 HDFS文件系统命令
上传文件到HDFS
bashhdfs dfs -put <local_src> <hdfs_dst>
查看文件系统根目录的文件夹
bashhdfs dfs -ls /
显示Hadoop上的文件内容
bashhdfs dfs -cat <hdfs_file>
从Hadoop上获取文件到本地
bashhdfs dfs -get <hdfs_src> <local_dst>
在Hadoop上删除文件
bashhdfs dfs -rm <hdfs_file>
在Hadoop上创建目录
bashhdfs dfs -mkdir <hdfs_dir>
在Hadoop上创建多级目录
bashhdfs dfs -mkdir -p <hdfs_dir_with_subdirs>
删除目录
bashhdfs dfs -rm -r <hdfs_dir>
重命名文件
bashhdfs dfs -mv <hdfs_src> <hdfs_dst>
3 权限管理类
改变文件所属组
bashhdfs dfs -chgrp <group> <path>
改变文件权限
bashhdfs dfs -chmod [-R] <permissions> <path>