Hadoop:单节点配置YARN

目录

[一、Hadoop YARN介绍](#一、Hadoop YARN介绍)

二、单节点配置YARN

[2.1 配置yarn-site.xml 文件](#2.1 配置yarn-site.xml 文件)

[2.2 配置 mapred-site.xml 文件](#2.2 配置 mapred-site.xml 文件)

[2.3 启动 Hadoop 和 YARN](#2.3 启动 Hadoop 和 YARN)

[2.4 浏览器访问](#2.4 浏览器访问)

三、YARN的常用命令

[3.1 启动和停止 YARN](#3.1 启动和停止 YARN)

[3.2 查看和管理应用程序](#3.2 查看和管理应用程序)

[3.3 查看和管理节点](#3.3 查看和管理节点)

[3.4 查看和管理队列](#3.4 查看和管理队列)

[3.5 查看和管理资源](#3.5 查看和管理资源)

[3.6 查看和管理应用](#3.6 查看和管理应用)


一、Hadoop YARN介绍

Hadoop YARN(Yet Another Resource Negotiator)是Hadoop的资源管理层,负责管理和分配集群中应用程序的资源。在单节点上设置Hadoop YARN时,通常是为了开发或测试目的,因为单节点设置无法提供多节点集群所具有的容错性和可扩展性优势。

二、单节点配置YARN

参考Hadoop:单机伪分布式部署 部署单机版hadoop后,再按以下步骤配置单机版YARN。

2.1 配置yarn-site.xml 文件

XML 复制代码
<configuration>

<!-- Site specific YARN configuration properties -->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>localhost</value>
    </property>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
        <name>yarn.nodemanager.env-whitelist</name>
        <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_HOME,PATH,LANG,TZ,HADOOP_MAPRED_HOME</value>
    </property>
    <!-- 需要指定webapp IP,否则单机版yarn,其他主机无法访问 -->
    <property>
        <name>yarn.resourcemanager.webapp.address</name>
        <value>192.168.179.141:8088</value>
    </property>
</configuration>

2.2 配置 mapred-site.xml 文件

XML 复制代码
<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
    <property>
        <name>mapreduce.application.classpath</name>
        <value>$HADOOP_MAPRED_HOME/share/hadoop/mapreduce/*:$HADOOP_MAPRED_HOME/share/hadoop/mapreduce/lib/*</value>
    </property>
</configuration>

2.3 启动 Hadoop 和 YARN

bash 复制代码
start-dfs.sh
start-yarn.sh

2.4 浏览器访问

三、YARN的常用命令

3.1 启动和停止 YARN

bash 复制代码
#### 启动 YARN
start-yarn.sh

#### 停止 YARN
stop-yarn.sh

3.2 查看和管理应用程序

bash 复制代码
#### 列出所有正在运行的应用程序
yarn application -list

#### 查看特定应用程序的详细信息
yarn application -status <application-id>

#### 杀死一个应用程序
yarn application -kill <application-id>

#### 查看应用程序的日志
yarn logs -applicationId <application-id>

3.3 查看和管理节点

bash 复制代码
#### 列出所有节点的信息
yarn node -list

#### 查看特定节点的详细信息
yarn node -status <node-id>

3.4 查看和管理队列

bash 复制代码
#### 列出所有队列的信息
yarn queue -list all

#### 查看特定队列的详细信息
yarn queue -info <queue-name>

3.5 查看和管理资源

bash 复制代码
#### 查看集群资源的使用情况
yarn top

#### 查看特定应用程序的资源使用情况
yarn application -status <application-id>

3.6 查看和管理应用

bash 复制代码
#### 提交一个 MapReduce 作业
hadoop jar <path-to-jar> <main-class> <input-path> <output-path>

#### 提交一个通用 YARN 应用程序
yarn jar <path-to-jar> <main-class> <arguments>

#### 列出所有正在运行的应用程序
yarn application -list

#### 查看特定应用程序的详细信息
yarn application -status <application-id>

#### 杀死一个应用程序
yarn application -kill <application-id>

#### 查看应用程序的日志
yarn logs -applicationId <application-id>
相关推荐
Justice Young10 小时前
Hive第四章:HIVE Operators and Functions
大数据·数据仓库·hive·hadoop
LF3_11 小时前
hive,Relative path in absolute URI: ${system:user.name%7D 解决
数据仓库·hive·hadoop
德彪稳坐倒骑驴13 小时前
Hive SQL常遗忘的命令
hive·hadoop·sql
Justice Young14 小时前
Hive第六章:Hive Optimization and Miscellaneous
数据仓库·hive·hadoop
Justice Young14 小时前
Hive第三章:HQL的使用
大数据·数据仓库·hive·hadoop
AC赳赳老秦1 天前
Python 爬虫进阶:DeepSeek 优化反爬策略与动态数据解析逻辑
开发语言·hadoop·spring boot·爬虫·python·postgresql·deepseek
zgl_200537791 天前
ZGLanguage 解析SQL数据血缘 之 标识提取SQL语句中的目标表
java·大数据·数据库·数据仓库·hadoop·sql·源代码管理
sheji34161 天前
【开题答辩全过程】以 基于Hadoop教育平台的设计与实现为例,包含答辩的问题和答案
大数据·hadoop·分布式
yumgpkpm2 天前
Cloudera CDH5、CDH6、CDP7现状及替代方案
数据库·人工智能·hive·hadoop·elasticsearch·数据挖掘·kafka
毕设源码-钟学长2 天前
【开题答辩全过程】以 基于Hadoop的新闻推荐系统为例,包含答辩的问题和答案
大数据·hadoop·分布式