十七、如何将MapReduce程序提交到YARN运行

1、启动某个节点的某一个用户

cs 复制代码
hadoop@node1:~$ jps
13025 Jps
hadoop@node1:~$ yarn --daemon start resourcemanager
hadoop@node1:~$ jps
13170 ResourceManager
13253 Jps
hadoop@node1:~$ yarn --daemon start nodemanager
hadoop@node1:~$ jps
13170 ResourceManager
15062 Jps
14890 NodeManager

2、常见程序

3、 提交实例

(1)使用自带程序提交

(2) 语法

此处需要注意,对于有返回值的程序,需要指定程序参数。

(3)明确命令jar命令所在目录

cs 复制代码
/export/server/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar

对于这些Hadoop内置的程序,他们都存储在hadoop-mapreduce-examples-3.3.6.jar中,如wordcount单词计数程序、pi求圆周率程序。

(4)执行wordcount程序(默认文件已经上传到hdfs文件系统)

~前提

首先,明确wordcount程序有返回值,所以需要指定程序参数:

程序参数\]:参数1是数据输入路径(hdfs://node1:8020/input/wordcount/) \[程序参数\]:参数2是结果输出路径(hdfs://node1:8020/output/wc1),需要确保输出的文件夹不存在,否则会报错 #### \~执行 ```cs hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.1.jar wordcount hdfs://node1:8020/input/wordcount/ hdfs://node1:8020/output/some ``` #### \~查看结果 执行完成后,查看some文件夹,可以看到some文件夹中存在两个子文件,第一个文件的文件名的最后一个单词,代表了本次程序运行是否成功,第二个文件存放着程序运行之后的结果。 ```cs hadoop@node1:~$ hdfs dfs -ls hdfs://node1:8020/output/some Found 2 items -rw-r--r-- 3 hadoop supergroup 0 2023-12-16 22:37 hdfs://node1:8020/output/some/_SUCCESS -rw-r--r-- 3 hadoop supergroup 351 2023-12-16 22:37 hdfs://node1:8020/output/some/part-r-00000 ``` 程序运行之后的结果为: ```cs hadoop@node1:~$ hdfs dfs -cat hdfs://node1:8020/output/some/part-r-00000 Because 1 Hello,my 1 I 7 I'll 1 If 1 Now 1 XX 1 XXX. 1 a 2 am 1 best 1 bird. 1 blue 1 can 2 chance 1 child. 1 come 1 day 1 do 1 dream 2 everything 1 fly 1 graduatedfrom 1 have 2 i 1 in 1 is 1 it 1 job. 2 like 1 love 1 make 1 my 1 name 1 old.I 1 one 1 since 1 sky 1 some 3 take 1 that 1 the 3 this 2 to 2 true. 1 try 1 was 1 well. 1 years 1 yjbys. 1 ``` ### (5)在Hadoop提供的Web页面上查看 #### \~点击程序名 ![](https://file.jishuzhan.net/article/1736299697636642818/00a8d4df9a479fa5ff34a9f06148dcf5.webp) #### \~查看详细信息 ![](https://file.jishuzhan.net/article/1736299697636642818/17928bd800c6ef5016d3bd6101283e72.webp) ![](https://file.jishuzhan.net/article/1736299697636642818/88e652cb8690b3269d063848d9d233ab.webp) #### \~查看运行日志 ![](https://file.jishuzhan.net/article/1736299697636642818/6b5fe343e5b47c2af63b064cb72a9203.webp) ![](https://file.jishuzhan.net/article/1736299697636642818/b2a938bd4d9968ad97a8fae02ebb7d8c.webp) #### \~map 和 reduce任务历史查看 ![](https://file.jishuzhan.net/article/1736299697636642818/507fb9927932b73f25b29cd7925a95f6.webp) ![](https://file.jishuzhan.net/article/1736299697636642818/89fdbf8687a58af32fca2b220ffb4672.webp) ![](https://file.jishuzhan.net/article/1736299697636642818/66f01767001ba4e48f6c3e151fd8d343.webp)

相关推荐
STLearner3 分钟前
AI论文速读 | U-Cast:学习高维时间序列预测的层次结构
大数据·论文阅读·人工智能·深度学习·学习·机器学习·数据挖掘
小白电脑技术3 分钟前
旧电脑安装流畅的系统?用虚拟机先体验一下Linux Mint!
linux·电脑
数字化顾问5 分钟前
(65页PPT)大型集团物料主数据管理系统建设规划方案(附下载方式)
大数据·运维·人工智能
翼龙云_cloud15 分钟前
阿里云渠道商:新手怎么操作阿里云无影云电脑?
运维·服务器·阿里云·云计算·电脑
拾忆,想起1 小时前
Dubbo服务调用流程全解析:从请求到响应的微服务通信之旅
服务器·网络·微服务·云原生·架构·dubbo
老蒋新思维1 小时前
创客匠人 2025 全球创始人 IP+AI 万人高峰论坛:AI 赋能下知识变现与 IP 变现的实践沉淀与行业启示
大数据·人工智能·网络协议·tcp/ip·重构·创始人ip·创客匠人
永不停歇的蜗牛1 小时前
Maven的POM文件相关标签作用
服务器·前端·maven
爱吃萝卜的美羊羊2 小时前
ubuntu下国内升级ollama
linux·运维·ubuntu
Erwin Rommel5592 小时前
nginx的https服务搭建实验
服务器·nginx·https
mzhan0172 小时前
Linux: console: printk: console_no_auto_verbose
linux·运维·服务器