Hadoop——分布式计算MapReduce和资源调度Yarn

分布式计算

MapReduce

YARN架构


YARN集群部署


一、Hadoop安装目录下/etc/hadoop修改mapred-env配置文件,mapred-site.xml文件

二、etc/hadoop文件内,修改yarn-env.sh,yarn-site.xml

三、将配置好的文件分发到其他服务节点

bash 复制代码
start-dfs.sh

四、进程启动命令

通过jps命令查看

五、通过浏览器查看

切换到root,init 0进行关机,设定快照

提交MapReduce任务到Yarn

①、提交wordcount单词计数

Ⅰ:准备一个words.txt文件,并上传到HDFS中

bash 复制代码
vim words.txt 
hadoop fs -mkdir -p /input
hadoop fs -mkdir /output

hadoop fs -put words.txt /input/

hadoop jar /export/server/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.4.jar wordcount hdfs://node1:8020/input/ hdfs://node1:8020/output/wc  # 确保输出文件夹不存在

查看输出结果

②、圆周率

bash 复制代码
hadoop jar /export/server/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.4.jar pi 3 1000
相关推荐
lichong9512 小时前
API开发工具postman、国内xxapi和SmartApi的性能对比
eclipse·intellij-idea·api·postman·visual studio·apipost·apifox
BillKu7 小时前
推荐 Eclipse Temurin 的 OpenJDK
java·ide·eclipse
悟能不能悟7 小时前
eclipse怎么把项目设为web
java·eclipse
Lx35217 小时前
Hadoop数据处理模式:批处理与流处理结合技巧
大数据·hadoop
皆过客,揽星河18 小时前
Linux上安装MySQL8详细教程
android·linux·hadoop·mysql·linux安装mysql·数据库安装·详细教程
core51220 小时前
Hive实战(二)
数据仓库·hive·hadoop
奋斗的蛋黄1 天前
大数据与云计算知识点
大数据·hadoop·云计算
weixin_404551241 天前
eclipse 安装 lombok
eclipse·lombok·install
计算机编程-吉哥1 天前
大数据毕业设计-基于Python的中文起点网小说数据分析平台(高分计算机毕业设计选题·定制开发·真正大数据)
大数据·hadoop·计算机毕业设计选题·机器学习毕业设计·大数据毕业设计·大数据毕业设计选题推荐·大数据毕设项目
Agatha方艺璇2 天前
Hive基础简介
数据仓库·hive·hadoop