Hadoop 集群的常用命令

一、基本文件操作

hadoop fs -ls <path>: 列出目录内容

hadoop fs -mkdir <path>: 创建目录

hadoop fs -put <local> <hdfs>: 从本地复制文件到HDFS

hadoop fs -get <hdfs> <local>: 从HDFS复制文件到本地

hadoop fs -cat <path>: 查看文件内容

hadoop fs -tail <path>: 查看文件尾部内容

hadoop fs -rm <path>: 删除文件

hadoop fs -rm -r <path>: 递归删除目录

二、文件管理

hadoop fs -cp <src> <dst>: 复制文件

hadoop fs -mv <src> <dst>: 移动文件

hadoop fs -du -h <path>: 显示目录/文件大小

hadoop fs -count <path>: 统计文件/目录数量

三、权限管理

hadoop fs -chmod <mode> <path>: 修改文件权限

hadoop fs -chown <owner>:<group> <path>: 修改文件所有者

hadoop fs -chgrp <group> <path>: 修改文件所属组

四、集群管理命令启动/停止服务

start-dfs.sh: 启动HDFS

stop-dfs.sh: 停止HDFS

start-yarn.sh: 启动YARN

stop-yarn.sh: 停止YARN

start-all.sh: 启动所有服务(已过时)

stop-all.sh: 停止所有服务(已过时)

相关推荐
Acrelgq2314 分钟前
工厂能耗系统智能化解决方案 —— 安科瑞企业能源管控平台
大数据·人工智能·物联网
程序猿阿伟43 分钟前
《分布式软总线架构下,设备虚拟化技术的深度剖析与优化策略》
分布式·架构
D愿你归来仍是少年3 小时前
使用 PySpark 批量清理 Hive 表历史分区
大数据·数据仓库·hive·spark
End9283 小时前
Hadoop的三大结构及其作用?
大数据·hadoop·分布式
chat2tomorrow5 小时前
数据仓库 vs 数据湖:架构、应用场景与技术差异全解析
大数据·数据仓库·低代码·架构·数据湖·sql2api
塔能物联运维5 小时前
双轮驱动能源革命:能源互联网与分布式能源赋能工厂能效跃迁
大数据·运维
-曾牛6 小时前
Git Flow
大数据·git·学习·elasticsearch·个人开发
461K.7 小时前
spark与hadoop的区别
大数据·运维·hadoop·分布式·spark·intellij-idea
Zfox_7 小时前
Git 进阶之路:高效协作之分支管理
大数据·linux·运维·c++·git·elasticsearch
lilye667 小时前
精益数据分析(11/126):辨别虚荣指标,挖掘数据真价值
大数据·人工智能·数据分析