hadoop 集群的常用命令

以下是 Hadoop 集群中一些常用的命令:

HDFS(Hadoop 分布式文件系统)命令

1. 启动和停止 HDFS

  • **启动 HDFS**

```bash

start-dfs.sh

```

该命令会启动 NameNode、SecondaryNameNode 和 DataNode 服务,这些服务共同构成了 HDFS 的核心组件。NameNode 管理文件系统的命名空间和客户端对文件的访问,DataNode 负责存储实际的数据块,SecondaryNameNode 协助 NameNode 进行元数据的检查点操作。

  • **停止 HDFS**

```bash

stop-dfs.sh

```

此命令用于停止上述提到的 HDFS 相关服务。

2. 创建目录

```bash

hdfs dfs -mkdir /new_directory

```

这个命令会在 HDFS 根目录下创建一个名为 `new_directory` 的新目录。你可以根据需要修改目录的路径和名称。

3. 查看文件和目录

  • **查看指定目录下的文件和子目录**

```bash

hdfs dfs -ls /path/to/directory

```

将 `/path/to/directory` 替换为你要查看的实际目录路径,该命令会列出该目录下的所有文件和子目录的详细信息,包括权限、所有者、大小和修改时间等。

  • **递归查看目录下的所有文件和子目录**

```bash

hdfs dfs -ls -R /path/to/directory

```

使用 `-R` 选项可以递归地列出指定目录及其所有子目录下的文件和子目录。

4. 上传文件到 HDFS

```bash

hdfs dfs -put local_file /hdfs_destination

```

`local_file` 是本地文件的路径,`/hdfs_destination` 是 HDFS 上的目标路径。该命令会将本地文件上传到 HDFS 指定的位置。

5. 从 HDFS 下载文件

```bash

hdfs dfs -get /hdfs_file local_destination

```

`/hdfs_file` 是 HDFS 上的文件路径,`local_destination` 是本地的目标路径。此命令会将 HDFS 上的文件下载到本地指定的位置。

6. 删除文件或目录

```bash

hdfs dfs -rm -r /path/to/file_or_directory

```

使用 `-rm` 命令删除文件,若要删除目录则需要加上 `-r` 选项进行递归删除。

YARN(Yet Another Resource Negotiator)命令

1. 启动和停止 YARN

  • **启动 YARN**

```bash

start-yarn.sh

```

该命令会启动 ResourceManager 和 NodeManager 服务。ResourceManager 负责整个集群的资源管理和调度,NodeManager 负责在每个节点上管理容器并监控资源使用情况。

  • **停止 YARN**

```bash

stop-yarn.sh

```

此命令用于停止上述的 YARN 相关服务。

2. 查看 YARN 应用程序状态

```bash

yarn application -list

```

该命令会列出当前 YARN 集群中所有应用程序的详细信息,包括应用程序 ID、名称、状态、启动时间等。

3. 杀死 YARN 应用程序

```bash

yarn application -kill application_id

```

将 `application_id` 替换为你要终止的应用程序的实际 ID,该命令会强制终止指定的 YARN 应用程序。

MapReduce 命令

运行 MapReduce 作业

```bash

hadoop jar /path/to/your/jar/file.jar main_class input_path output_path

```

`/path/to/your/jar/file.jar` 是包含 MapReduce 作业代码的 JAR 文件路径,`main_class` 是作业的主类名,`input_path` 是输入数据在 HDFS 上的路径,`output_path` 是作业输出结果在 HDFS 上的路径。

以上这些命令是 Hadoop 集群中比较常用的命令,通过熟练使用这些命令,你可以有效地管理 HDFS 文件系统、调度 YARN 资源以及运行 MapReduce 作业。

相关推荐
码上淘金44 分钟前
【Python】Python常用控制结构详解:条件判断、遍历与循环控制
开发语言·python
Brilliant Nemo1 小时前
四、SpringMVC实战:构建高效表述层框架
开发语言·python
格林威3 小时前
Baumer工业相机堡盟工业相机的工业视觉中为什么偏爱“黑白相机”
开发语言·c++·人工智能·数码相机·计算机视觉
橙子199110163 小时前
在 Kotlin 中什么是委托属性,简要说说其使用场景和原理
android·开发语言·kotlin
androidwork3 小时前
Kotlin Android LeakCanary内存泄漏检测实战
android·开发语言·kotlin
学地理的小胖砸3 小时前
【Python 基础语法】
开发语言·python
DanB245 小时前
Java笔记4
java·开发语言·笔记
Dddle15 小时前
C++:this指针
java·c语言·开发语言·c++
studyer_domi5 小时前
Matlab 234-锂电池充放电仿真
开发语言·matlab
yuanpan5 小时前
.net/C#进程间通信技术方案总结
开发语言·c#·.net