十七、如何将MapReduce程序提交到YARN运行

1、启动某个节点的某一个用户

cs 复制代码
hadoop@node1:~$ jps
13025 Jps
hadoop@node1:~$ yarn --daemon start resourcemanager
hadoop@node1:~$ jps
13170 ResourceManager
13253 Jps
hadoop@node1:~$ yarn --daemon start nodemanager
hadoop@node1:~$ jps
13170 ResourceManager
15062 Jps
14890 NodeManager

2、常见程序

3、 提交实例

(1)使用自带程序提交

(2) 语法

此处需要注意,对于有返回值的程序,需要指定程序参数。

(3)明确命令jar命令所在目录

cs 复制代码
/export/server/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar

对于这些Hadoop内置的程序,他们都存储在hadoop-mapreduce-examples-3.3.6.jar中,如wordcount单词计数程序、pi求圆周率程序。

(4)执行wordcount程序(默认文件已经上传到hdfs文件系统)

~前提

首先,明确wordcount程序有返回值,所以需要指定程序参数:

程序参数\]:参数1是数据输入路径(hdfs://node1:8020/input/wordcount/) \[程序参数\]:参数2是结果输出路径(hdfs://node1:8020/output/wc1),需要确保输出的文件夹不存在,否则会报错 #### \~执行 ```cs hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.1.jar wordcount hdfs://node1:8020/input/wordcount/ hdfs://node1:8020/output/some ``` #### \~查看结果 执行完成后,查看some文件夹,可以看到some文件夹中存在两个子文件,第一个文件的文件名的最后一个单词,代表了本次程序运行是否成功,第二个文件存放着程序运行之后的结果。 ```cs hadoop@node1:~$ hdfs dfs -ls hdfs://node1:8020/output/some Found 2 items -rw-r--r-- 3 hadoop supergroup 0 2023-12-16 22:37 hdfs://node1:8020/output/some/_SUCCESS -rw-r--r-- 3 hadoop supergroup 351 2023-12-16 22:37 hdfs://node1:8020/output/some/part-r-00000 ``` 程序运行之后的结果为: ```cs hadoop@node1:~$ hdfs dfs -cat hdfs://node1:8020/output/some/part-r-00000 Because 1 Hello,my 1 I 7 I'll 1 If 1 Now 1 XX 1 XXX. 1 a 2 am 1 best 1 bird. 1 blue 1 can 2 chance 1 child. 1 come 1 day 1 do 1 dream 2 everything 1 fly 1 graduatedfrom 1 have 2 i 1 in 1 is 1 it 1 job. 2 like 1 love 1 make 1 my 1 name 1 old.I 1 one 1 since 1 sky 1 some 3 take 1 that 1 the 3 this 2 to 2 true. 1 try 1 was 1 well. 1 years 1 yjbys. 1 ``` ### (5)在Hadoop提供的Web页面上查看 #### \~点击程序名 ![](https://file.jishuzhan.net/article/1736299697636642818/00a8d4df9a479fa5ff34a9f06148dcf5.webp) #### \~查看详细信息 ![](https://file.jishuzhan.net/article/1736299697636642818/17928bd800c6ef5016d3bd6101283e72.webp) ![](https://file.jishuzhan.net/article/1736299697636642818/88e652cb8690b3269d063848d9d233ab.webp) #### \~查看运行日志 ![](https://file.jishuzhan.net/article/1736299697636642818/6b5fe343e5b47c2af63b064cb72a9203.webp) ![](https://file.jishuzhan.net/article/1736299697636642818/b2a938bd4d9968ad97a8fae02ebb7d8c.webp) #### \~map 和 reduce任务历史查看 ![](https://file.jishuzhan.net/article/1736299697636642818/507fb9927932b73f25b29cd7925a95f6.webp) ![](https://file.jishuzhan.net/article/1736299697636642818/89fdbf8687a58af32fca2b220ffb4672.webp) ![](https://file.jishuzhan.net/article/1736299697636642818/66f01767001ba4e48f6c3e151fd8d343.webp)

相关推荐
小oo呆2 小时前
【学习心得】CMD终端设置Proxy的几个要点
运维·服务器·网络
Forget_85502 小时前
RHEL——制作母盘
linux·运维·服务器
刺客xs2 小时前
git 入门常用命令
大数据·git·elasticsearch
risc1234562 小时前
【Elasticsearch】LeafDocLookup 详述
大数据·elasticsearch·mybatis
释怀不想释怀2 小时前
Linux命令--echo~反引号符~重定向符(>>)~tail命令
linux·运维·服务器
qq_12498707532 小时前
基于协同过滤算法的运动场馆服务平台设计与实现(源码+论文+部署+安装)
java·大数据·数据库·人工智能·spring boot·毕业设计·计算机毕业设计
云小逸2 小时前
【Nmap 设备类型识别技术】整体概况
服务器·c语言·网络·c++·nmap
路由侠内网穿透.3 小时前
fnOS 飞牛云 NAS 本地部署私人影视库 MoonTV 并实现外部访问
运维·服务器·网络·数据库·网络协议
徐先生 @_@|||3 小时前
Spark DataFrame常见的Transformation和Actions详解
大数据·分布式·spark
hnult3 小时前
全功能学练考证在线考试平台,赋能技能认证
大数据·人工智能·笔记·课程设计