hadoop的常用命令

Hadoop集群中包含了多个组件,如HDFS(Hadoop Distributed File System)、YARN(Yet Another Resource Negotiator)等,以下是一些常用的命令:

HDFS相关命令

  1. **查看文件系统**
  • `hdfs dfs -ls`:列出文件系统中的文件和目录。

  • `hdfs dfs -ls -h`:以更易读的格式显示文件大小。

  • `hdfs dfs -ls -R`:递归显示目录下的所有文件和子目录。

  • `hdfs dfs -ls /`:查看根目录下的内容。

  1. **创建目录**
  • `hdfs dfs -mkdir /path/to/directory`:创建指定目录。

  • `hdfs dfs -mkdir -p /path/to/directory`:递归创建目录,如果父目录不存在会自动创建。

  1. **上传文件**
  • `hdfs dfs -put localfile /path/to/hdfs`:将本地文件上传到HDFS指定路径。

  • `hdfs dfs -copyFromLocal localfile /path/to/hdfs`:与`put`命令功能相同。

  1. **下载文件**
  • `hdfs dfs -get /path/to/hdfs localfile`:将HDFS中的文件下载到本地。

  • `hdfs dfs -copyToLocal /path/to/hdfs localfile`:与`get`命令功能相同。

  1. **删除文件或目录**
  • `hdfs dfs -rm /path/to/file`:删除指定文件。

  • `hdfs dfs -rm -r /path/to/directory`:递归删除目录及其内容。

  • `hdfs dfs -rm -r -f /path/to/directory`:强制删除目录及其内容,不提示确认。

  1. **查看文件内容**
  • `hdfs dfs -cat /path/to/file`:查看文件内容。

  • `hdfs dfs -tail /path/to/file`:查看文件的最后部分内容。

  1. **查看文件系统状态**
  • `hdfs dfsadmin -report`:查看HDFS集群的健康状态和存储情况。

  • `hdfs dfs -df -h`:查看HDFS的磁盘使用情况。

YARN相关命令

  1. **查看YARN集群状态**
  • `yarn cluster -status`:查看YARN集群的运行状态。

  • `yarn node -status`:查看节点状态。

  1. **查看正在运行的作业**
  • `yarn application -list`:列出所有正在运行的作业。

  • `yarn application -status application_id`:查看指定作业的状态。

  1. **杀死作业**
  • `yarn application -kill application_id`:终止指定的作业。
  1. **查看队列信息**
  • `yarn queue -status`:查看队列的使用情况和状态。

Hadoop守护进程相关命令

  1. **启动Hadoop集群**
  • `start-dfs.sh`:启动HDFS守护进程。

  • `start-yarn.sh`:启动YARN守护进程。

  • `start-all.sh`:启动HDFS和YARN守护进程(不推荐使用,建议分别启动)。

  1. **停止Hadoop集群**
  • `stop-dfs.sh`:停止HDFS守护进程。

  • `stop-yarn.sh`:停止YARN守护进程。

  • `stop-all.sh`:停止HDFS和YARN守护进程。

  1. **格式化HDFS文件系统**
  • `hdfs namenode -format`:格式化HDFS文件系统,通常在首次安装或重置集群时使用。
  1. **查看守护进程状态**
  • `jps`:查看当前Java进程,包括Hadoop守护进程。

这些命令是Hadoop集群操作的基础,根据实际需求,可能还需要结合其他工具和命令进行更复杂的操作。

基于ai生成 可能有误

相关推荐
计算机编程小央姐19 小时前
大数据工程师认证项目:汽车之家数据分析系统,Hadoop分布式存储+Spark计算引擎
大数据·hadoop·分布式·数据分析·spark·汽车·课程设计
大数据CLUB20 小时前
基于mapreduce的资金流入流出任务计算
大数据·hadoop·mapreduce
计算机毕设残哥1 天前
基于Hadoop+Spark的人体体能数据分析与可视化系统开源实现
大数据·hadoop·python·scrapy·数据分析·spark·dash
IT研究室2 天前
大数据毕业设计选题推荐-基于大数据的全球产品库存数据分析与可视化系统-大数据-Spark-Hadoop-Bigdata
大数据·hadoop·数据分析·spark·毕业设计·源码·bigdata
weixin_525936333 天前
2020年美国新冠肺炎疫情数据分析与可视化
hadoop·python·数据挖掘·数据分析·spark·数据可视化
毕设源码-朱学姐3 天前
【开题答辩全过程】以 python基于Hadoop的服装穿搭系统的设计与实现为例,包含答辩的问题和答案
开发语言·hadoop·python
IT学长编程3 天前
计算机毕业设计 基于Hadoop的信贷风险评估的数据可视化分析与预测系统 大数据毕业设计 Hadoop毕业设计选题【附源码+文档报告+安装调试】
大数据·hadoop·毕业设计·课程设计·毕业论文·信贷风险评估的可视化分析与预测·hadoop大数据
计算机毕设残哥4 天前
基于Hadoop+Spark的商店购物趋势分析与可视化系统技术实现
大数据·hadoop·python·scrapy·spark·django·dash
IT研究室4 天前
大数据毕业设计选题推荐-基于大数据的全球能源消耗量数据分析与可视化系统-大数据-Spark-Hadoop-Bigdata
大数据·hadoop·spark·毕业设计·源码·数据可视化·bigdata
大叔_爱编程5 天前
基于Hadoop的美妆产品网络评价的数据采集与分析-django+spider
大数据·hadoop·django·毕业设计·源码·课程设计·美妆产品