Hadoop——分布式计算MapReduce和资源调度Yarn

分布式计算

MapReduce

YARN架构


YARN集群部署


一、Hadoop安装目录下/etc/hadoop修改mapred-env配置文件,mapred-site.xml文件

二、etc/hadoop文件内,修改yarn-env.sh,yarn-site.xml

三、将配置好的文件分发到其他服务节点

bash 复制代码
start-dfs.sh

四、进程启动命令

通过jps命令查看

五、通过浏览器查看

切换到root,init 0进行关机,设定快照

提交MapReduce任务到Yarn

①、提交wordcount单词计数

Ⅰ:准备一个words.txt文件,并上传到HDFS中

bash 复制代码
vim words.txt 
hadoop fs -mkdir -p /input
hadoop fs -mkdir /output

hadoop fs -put words.txt /input/

hadoop jar /export/server/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.4.jar wordcount hdfs://node1:8020/input/ hdfs://node1:8020/output/wc  # 确保输出文件夹不存在

查看输出结果

②、圆周率

bash 复制代码
hadoop jar /export/server/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.4.jar pi 3 1000
相关推荐
B站计算机毕业设计超人6 天前
计算机毕业设计Django+Vue.js高考推荐系统 高考可视化 大数据毕业设计(源码+LW文档+PPT+详细讲解)
大数据·vue.js·hadoop·django·毕业设计·课程设计·推荐算法
B站计算机毕业设计超人6 天前
计算机毕业设计Django+Vue.js音乐推荐系统 音乐可视化 大数据毕业设计 (源码+文档+PPT+讲解)
大数据·vue.js·hadoop·python·spark·django·课程设计
十月南城6 天前
数据湖技术对比——Iceberg、Hudi、Delta的表格格式与维护策略
大数据·数据库·数据仓库·hive·hadoop·spark
王九思6 天前
Hive Thrift Server 介绍
数据仓库·hive·hadoop
Asher05096 天前
Hive核心知识:从基础到实战全解析
数据仓库·hive·hadoop
yumgpkpm6 天前
AI视频生成:Wan 2.2(阿里通义万相)在华为昇腾下的部署?
人工智能·hadoop·elasticsearch·zookeeper·flink·kafka·cloudera
花花鱼6 天前
eclipse 项目中src/main/java 和 src/main/resources 的显示排序
eclipse
Asher05096 天前
Hadoop核心技术与实战指南
大数据·hadoop·分布式
西门吹-禅6 天前
【eclipse 升级】
java·ide·eclipse
sheji34167 天前
【开题答辩全过程】以 婚纱影楼管理系统为例,包含答辩的问题和答案
java·eclipse