【Hadoop】- MapReduce & YARN 初体验[9]

提交MapReduce程序至YARN运行

在部署并成功YARN集群后，我们就可以在YARN上运行各类应用程序了。

YARN作为资源调度管控框架，其本身提供资源供许多程序运行，常见的有：

Spark与Flink是大数据后续学习内容，我们目前先来体验一下在YARN上执行MapReduce程序的过程。

Hadoop官方内置了一些预置的MapReduce程序代码，我们无需编程，只需要通过命令即可使用，常用的有2个MapReduce内置程序：

这些内置的示例MapReduce程序代码，都在：

$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.1.jar 这个文件内

可以通过hadoop jar命令来运行它，提交MapReduce程序到YARN中。

语法：hadoop jar 程序文件 java类名 [程序参数] ..... [程序参数]

单词计数示例程序的功能很简单：

我们可以准备一份数据文件，并上传到HDFS中。

语法：hadoop jar 程序文件 java类名 [程序参数] ..... [程序参数]

YARN给MapReduce提供资源，相当于给他提供了容器，然后他在容器里面完成了数据计算

可以执行如下命令，使用蒙特卡罗算法模拟计算求PI（圆周率）

hadoop jar /export/server/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.0.0.jar pi 3 1000

运行如下：

1、Hadoop自带的MapReduce示例程序的代码jar包是

$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.1.jar

2、使用什么命令提交MapReduce程序到YARN中执行？

hadoop jar 命令

语法：hadoop jar 程序文件 java类名 [程序参数] ..... [程序参数]

3、如何查看程序运行状态

在YARN WEB页面查看