Hadoop集群的常用命令

Hadoop集群的常用命令涵盖了文件系统操作、作业管理、集群监控等多个方面。以下是一些常用的Hadoop命令及其用途:

文件系统操作

Hadoop分布式文件系统(HDFS)是Hadoop的核心组件之一,以下命令用于管理HDFS中的文件和目录。

复制代码
hadoop fs -ls <path>

列出指定路径下的文件和目录。

复制代码
hadoop fs -mkdir <path>

在HDFS中创建目录。

复制代码
hadoop fs -put <local_path> <hdfs_path>

将本地文件或目录上传到HDFS。

复制代码
hadoop fs -get <hdfs_path> <local_path>

将HDFS中的文件或目录下载到本地。

复制代码
hadoop fs -rm <path>

删除HDFS中的文件或目录。

复制代码
hadoop fs -cat <path>

查看HDFS中文件的内容。

作业管理

Hadoop MapReduce是Hadoop的另一个核心组件,以下命令用于管理MapReduce作业。

复制代码
hadoop jar <jar_file> <main_class> <input_path> <output_path>

提交一个MapReduce作业。

复制代码
hadoop job -list

列出当前正在运行和已完成的作业。

复制代码
hadoop job -kill <job_id>

终止指定的MapReduce作业。

复制代码
hadoop job -status <job_id>

查看指定作业的状态。

集群监控

以下命令用于监控Hadoop集群的状态和性能。

复制代码
hadoop dfsadmin -report

查看HDFS集群的状态报告,包括节点信息、存储使用情况等。

复制代码
hadoop dfsadmin -safemode enter

将HDFS集群进入安全模式,此时只能读取数据,不能写入。

复制代码
hadoop dfsadmin -safemode leave

将HDFS集群退出安全模式,恢复正常读写操作。

复制代码
hadoop fsck <path>

检查HDFS中指定路径的文件系统健康状况。

其他常用命令

复制代码
hadoop version

查看Hadoop的版本信息。

复制代码
hadoop classpath

查看Hadoop的类路径。

复制代码
hadoop namenode -format

格式化HDFS的NameNode,通常在首次启动Hadoop集群时使用。


启动/停止服务

复制代码
   - start-dfs.sh

启动HDFS

复制代码
   - stop-dfs.sh

停止HDFS

复制代码
   - start-yarn.sh

启动YARN

复制代码
   - stop-yarn.sh

停止YARN

相关推荐
小小AK8 小时前
钉钉与金蝶云星空无缝集成方案
大数据·人工智能·钉钉
QYR_118 小时前
2026年全球寡核苷酸合成用固相载体行业深度洞察与展望
大数据·人工智能
xiaoduo AI11 小时前
客服机器人可按紧急程度排序会话?Agent 开放平台通过关键词设置优先级实现急救咨询优先处理?
大数据·机器人
hughnz12 小时前
钻井RTOC的能力以及趋势
大数据·人工智能
workflower12 小时前
机器人应用-楼宇室内巡逻
大数据·人工智能·算法·microsoft·机器人·动态规划·享元模式
电子科技圈12 小时前
从进迭时空K3看RISC-V CPU与Imagination GPU协同:如何构建高性能SoC能力
大数据·图像处理·人工智能·嵌入式硬件·边缘计算·智能硬件·risc-v
阿里云大数据AI技术12 小时前
EMR Serverless Spark 推出 Spark 4.0,加速湖仓架构下的数据处理升级
大数据·人工智能·spark
永霖光电_UVLED14 小时前
1.6T 光模块的能效革命
大数据·人工智能·汽车·娱乐
talen_hx29614 小时前
《零基础入门Spark》学习笔记 Day 17
大数据·笔记·学习·spark
hf20001214 小时前
深入分析:Iceberg v3「删除向量(Deletion Vectors, DV)」如何缓解 CDC 场景写放大
大数据·spark·数据湖·湖仓一体·lakehouse