hadoop的常用命令

Hadoop集群中包含了多个组件,如HDFS(Hadoop Distributed File System)、YARN(Yet Another Resource Negotiator)等,以下是一些常用的命令:

HDFS相关命令

  1. **查看文件系统**
  • `hdfs dfs -ls`:列出文件系统中的文件和目录。

  • `hdfs dfs -ls -h`:以更易读的格式显示文件大小。

  • `hdfs dfs -ls -R`:递归显示目录下的所有文件和子目录。

  • `hdfs dfs -ls /`:查看根目录下的内容。

  1. **创建目录**
  • `hdfs dfs -mkdir /path/to/directory`:创建指定目录。

  • `hdfs dfs -mkdir -p /path/to/directory`:递归创建目录,如果父目录不存在会自动创建。

  1. **上传文件**
  • `hdfs dfs -put localfile /path/to/hdfs`:将本地文件上传到HDFS指定路径。

  • `hdfs dfs -copyFromLocal localfile /path/to/hdfs`:与`put`命令功能相同。

  1. **下载文件**
  • `hdfs dfs -get /path/to/hdfs localfile`:将HDFS中的文件下载到本地。

  • `hdfs dfs -copyToLocal /path/to/hdfs localfile`:与`get`命令功能相同。

  1. **删除文件或目录**
  • `hdfs dfs -rm /path/to/file`:删除指定文件。

  • `hdfs dfs -rm -r /path/to/directory`:递归删除目录及其内容。

  • `hdfs dfs -rm -r -f /path/to/directory`:强制删除目录及其内容,不提示确认。

  1. **查看文件内容**
  • `hdfs dfs -cat /path/to/file`:查看文件内容。

  • `hdfs dfs -tail /path/to/file`:查看文件的最后部分内容。

  1. **查看文件系统状态**
  • `hdfs dfsadmin -report`:查看HDFS集群的健康状态和存储情况。

  • `hdfs dfs -df -h`:查看HDFS的磁盘使用情况。

YARN相关命令

  1. **查看YARN集群状态**
  • `yarn cluster -status`:查看YARN集群的运行状态。

  • `yarn node -status`:查看节点状态。

  1. **查看正在运行的作业**
  • `yarn application -list`:列出所有正在运行的作业。

  • `yarn application -status application_id`:查看指定作业的状态。

  1. **杀死作业**
  • `yarn application -kill application_id`:终止指定的作业。
  1. **查看队列信息**
  • `yarn queue -status`:查看队列的使用情况和状态。

Hadoop守护进程相关命令

  1. **启动Hadoop集群**
  • `start-dfs.sh`:启动HDFS守护进程。

  • `start-yarn.sh`:启动YARN守护进程。

  • `start-all.sh`:启动HDFS和YARN守护进程(不推荐使用,建议分别启动)。

  1. **停止Hadoop集群**
  • `stop-dfs.sh`:停止HDFS守护进程。

  • `stop-yarn.sh`:停止YARN守护进程。

  • `stop-all.sh`:停止HDFS和YARN守护进程。

  1. **格式化HDFS文件系统**
  • `hdfs namenode -format`:格式化HDFS文件系统,通常在首次安装或重置集群时使用。
  1. **查看守护进程状态**
  • `jps`:查看当前Java进程,包括Hadoop守护进程。

这些命令是Hadoop集群操作的基础,根据实际需求,可能还需要结合其他工具和命令进行更复杂的操作。

基于ai生成 可能有误

相关推荐
坚持就完事了2 小时前
Hadoop实战初步学习
hadoop·学习
It's Q8 小时前
hive学习分区&&函数
hive·hadoop·学习
lifewange12 小时前
Hadoop 全套常用 Shell 命令完整版
大数据·hadoop·npm
lifewange12 小时前
Hadoop 完整入门详解
大数据·hadoop·分布式
菜鸟小码1 天前
Hive数据模型、架构、表类型与优化策略
hive·hadoop·架构
IT从业者张某某1 天前
基于Docker的hadoop容器安装hive并测试
hive·hadoop·docker
IT从业者张某某1 天前
基于Docker的hadoop容器安装zookeeper
hadoop·docker·zookeeper
菜鸟小码1 天前
深入理解 Hive 数据模型
数据仓库·hive·hadoop
菜鸟小码2 天前
Hive环境搭建与配置优化
数据仓库·hive·hadoop
菜鸟小码2 天前
Hive数据类型全解析:从基础到复杂类型实战指南
数据仓库·hive·hadoop