Hadoop集群的常用命令

Hadoop集群的常用命令涵盖了文件系统操作、作业管理、集群监控等多个方面。以下是一些常用的Hadoop命令及其用途:

文件系统操作

Hadoop分布式文件系统(HDFS)是Hadoop的核心组件之一,以下命令用于管理HDFS中的文件和目录。

复制代码
hadoop fs -ls <path>

列出指定路径下的文件和目录。

复制代码
hadoop fs -mkdir <path>

在HDFS中创建目录。

复制代码
hadoop fs -put <local_path> <hdfs_path>

将本地文件或目录上传到HDFS。

复制代码
hadoop fs -get <hdfs_path> <local_path>

将HDFS中的文件或目录下载到本地。

复制代码
hadoop fs -rm <path>

删除HDFS中的文件或目录。

复制代码
hadoop fs -cat <path>

查看HDFS中文件的内容。

作业管理

Hadoop MapReduce是Hadoop的另一个核心组件,以下命令用于管理MapReduce作业。

复制代码
hadoop jar <jar_file> <main_class> <input_path> <output_path>

提交一个MapReduce作业。

复制代码
hadoop job -list

列出当前正在运行和已完成的作业。

复制代码
hadoop job -kill <job_id>

终止指定的MapReduce作业。

复制代码
hadoop job -status <job_id>

查看指定作业的状态。

集群监控

以下命令用于监控Hadoop集群的状态和性能。

复制代码
hadoop dfsadmin -report

查看HDFS集群的状态报告,包括节点信息、存储使用情况等。

复制代码
hadoop dfsadmin -safemode enter

将HDFS集群进入安全模式,此时只能读取数据,不能写入。

复制代码
hadoop dfsadmin -safemode leave

将HDFS集群退出安全模式,恢复正常读写操作。

复制代码
hadoop fsck <path>

检查HDFS中指定路径的文件系统健康状况。

其他常用命令

复制代码
hadoop version

查看Hadoop的版本信息。

复制代码
hadoop classpath

查看Hadoop的类路径。

复制代码
hadoop namenode -format

格式化HDFS的NameNode,通常在首次启动Hadoop集群时使用。


启动/停止服务

复制代码
   - start-dfs.sh

启动HDFS

复制代码
   - stop-dfs.sh

停止HDFS

复制代码
   - start-yarn.sh

启动YARN

复制代码
   - stop-yarn.sh

停止YARN

相关推荐
老蒋新思维6 小时前
创客匠人峰会深度解析:知识变现的 “信任 - 效率” 双闭环 —— 从 “单次交易” 到 “终身复购” 的增长密码
大数据·网络·人工智能·tcp/ip·重构·数据挖掘·创客匠人
EveryPossible8 小时前
优先级调整练习1
大数据·学习
B站计算机毕业设计之家9 小时前
基于大数据热门旅游景点数据分析可视化平台 数据大屏 Flask框架 Echarts可视化大屏
大数据·爬虫·python·机器学习·数据分析·spark·旅游
亿坊电商11 小时前
无人共享茶室智慧化破局:24H智能接单系统的架构实践与运营全景!
大数据·人工智能·架构
老蒋新思维11 小时前
创客匠人峰会新解:AI 时代知识变现的 “信任分层” 法则 —— 从流量到高客单的进阶密码
大数据·网络·人工智能·tcp/ip·重构·创始人ip·创客匠人
Jerry.张蒙11 小时前
SAP业财一体化实现的“隐形桥梁”-价值串
大数据·数据库·人工智能·学习·区块链·aigc·运维开发
一勺-_-12 小时前
.git文件夹
大数据·git·elasticsearch
秋刀鱼 ..13 小时前
2026年电力电子与电能变换国际学术会议 (ICPEPC 2026)
大数据·python·计算机网络·数学建模·制造
G皮T15 小时前
【Elasticsearch】 大慢查询隔离(一):最佳实践
大数据·elasticsearch·搜索引擎·性能调优·索引·性能·查询
expect7g16 小时前
Paimon源码解读 -- Compaction-6.CompactStrategy
大数据·后端·flink