十七、如何将MapReduce程序提交到YARN运行

1、启动某个节点的某一个用户

cs 复制代码
hadoop@node1:~$ jps
13025 Jps
hadoop@node1:~$ yarn --daemon start resourcemanager
hadoop@node1:~$ jps
13170 ResourceManager
13253 Jps
hadoop@node1:~$ yarn --daemon start nodemanager
hadoop@node1:~$ jps
13170 ResourceManager
15062 Jps
14890 NodeManager

2、常见程序

3、 提交实例

(1)使用自带程序提交

(2) 语法

此处需要注意,对于有返回值的程序,需要指定程序参数。

(3)明确命令jar命令所在目录

cs 复制代码
/export/server/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar

对于这些Hadoop内置的程序,他们都存储在hadoop-mapreduce-examples-3.3.6.jar中,如wordcount单词计数程序、pi求圆周率程序。

(4)执行wordcount程序(默认文件已经上传到hdfs文件系统)

~前提

首先,明确wordcount程序有返回值,所以需要指定程序参数:

程序参数\]:参数1是数据输入路径(hdfs://node1:8020/input/wordcount/) \[程序参数\]:参数2是结果输出路径(hdfs://node1:8020/output/wc1),需要确保输出的文件夹不存在,否则会报错 #### \~执行 ```cs hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.1.jar wordcount hdfs://node1:8020/input/wordcount/ hdfs://node1:8020/output/some ``` #### \~查看结果 执行完成后,查看some文件夹,可以看到some文件夹中存在两个子文件,第一个文件的文件名的最后一个单词,代表了本次程序运行是否成功,第二个文件存放着程序运行之后的结果。 ```cs hadoop@node1:~$ hdfs dfs -ls hdfs://node1:8020/output/some Found 2 items -rw-r--r-- 3 hadoop supergroup 0 2023-12-16 22:37 hdfs://node1:8020/output/some/_SUCCESS -rw-r--r-- 3 hadoop supergroup 351 2023-12-16 22:37 hdfs://node1:8020/output/some/part-r-00000 ``` 程序运行之后的结果为: ```cs hadoop@node1:~$ hdfs dfs -cat hdfs://node1:8020/output/some/part-r-00000 Because 1 Hello,my 1 I 7 I'll 1 If 1 Now 1 XX 1 XXX. 1 a 2 am 1 best 1 bird. 1 blue 1 can 2 chance 1 child. 1 come 1 day 1 do 1 dream 2 everything 1 fly 1 graduatedfrom 1 have 2 i 1 in 1 is 1 it 1 job. 2 like 1 love 1 make 1 my 1 name 1 old.I 1 one 1 since 1 sky 1 some 3 take 1 that 1 the 3 this 2 to 2 true. 1 try 1 was 1 well. 1 years 1 yjbys. 1 ``` ### (5)在Hadoop提供的Web页面上查看 #### \~点击程序名 ![](https://file.jishuzhan.net/article/1736299697636642818/00a8d4df9a479fa5ff34a9f06148dcf5.webp) #### \~查看详细信息 ![](https://file.jishuzhan.net/article/1736299697636642818/17928bd800c6ef5016d3bd6101283e72.webp) ![](https://file.jishuzhan.net/article/1736299697636642818/88e652cb8690b3269d063848d9d233ab.webp) #### \~查看运行日志 ![](https://file.jishuzhan.net/article/1736299697636642818/6b5fe343e5b47c2af63b064cb72a9203.webp) ![](https://file.jishuzhan.net/article/1736299697636642818/b2a938bd4d9968ad97a8fae02ebb7d8c.webp) #### \~map 和 reduce任务历史查看 ![](https://file.jishuzhan.net/article/1736299697636642818/507fb9927932b73f25b29cd7925a95f6.webp) ![](https://file.jishuzhan.net/article/1736299697636642818/89fdbf8687a58af32fca2b220ffb4672.webp) ![](https://file.jishuzhan.net/article/1736299697636642818/66f01767001ba4e48f6c3e151fd8d343.webp)

相关推荐
Rabitebla13 分钟前
【C++】string 类:原理、踩坑与对象语义
linux·c语言·数据结构·c++·算法·github·学习方法
Volunteer Technology18 分钟前
Elasticsearch分布式原理
大数据·分布式·elasticsearch
feng_you_ying_li20 分钟前
linux之shell的进阶补充和基础IO流的介绍
linux·运维·服务器
志栋智能1 小时前
运维超自动化:构建弹性IT架构的关键支撑
运维·服务器·网络·人工智能·架构·自动化
草莓熊Lotso2 小时前
Vibe Coding 时代:LangChain 与 LangGraph 全链路解析
linux·运维·服务器·数据库·人工智能·mysql·langchain
代码AI弗森8 小时前
一文理清楚“算力申请 / 成本测算 / 并发评估”
java·服务器·数据库
Promise微笑8 小时前
2026年国产替代油介损测试仪:油介损全场景解决方案与技术演进
大数据·网络·人工智能
workflower8 小时前
具身智能行业应用-生活服务业
大数据·人工智能·机器人·动态规划·生活
蜡台8 小时前
Python包管理工具pip完全指南-----2
linux·windows·python
^—app5668669 小时前
游戏运存小启动不起来临时解决方法
运维·服务器