Hadoop——分布式计算MapReduce和资源调度Yarn

分布式计算

MapReduce

YARN架构


YARN集群部署


一、Hadoop安装目录下/etc/hadoop修改mapred-env配置文件,mapred-site.xml文件

二、etc/hadoop文件内,修改yarn-env.sh,yarn-site.xml

三、将配置好的文件分发到其他服务节点

bash 复制代码
start-dfs.sh

四、进程启动命令

通过jps命令查看

五、通过浏览器查看

切换到root,init 0进行关机,设定快照

提交MapReduce任务到Yarn

①、提交wordcount单词计数

Ⅰ:准备一个words.txt文件,并上传到HDFS中

bash 复制代码
vim words.txt 
hadoop fs -mkdir -p /input
hadoop fs -mkdir /output

hadoop fs -put words.txt /input/

hadoop jar /export/server/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.4.jar wordcount hdfs://node1:8020/input/ hdfs://node1:8020/output/wc  # 确保输出文件夹不存在

查看输出结果

②、圆周率

bash 复制代码
hadoop jar /export/server/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.4.jar pi 3 1000
相关推荐
talle20217 小时前
Hadoop分布式资源管理框架【Yarn】
大数据·hadoop·分布式
yumgpkpm7 小时前
基于GPU的Spark应用加速 Cloudera CDP/华为CMP鲲鹏版+Nvidia英伟达联合解决方案
大数据·数据库·人工智能·hadoop·elasticsearch·spark·cloudera
talle20218 小时前
Hadoop分布式文件系统【HDFS】
大数据·hadoop·hdfs
毕设源码-邱学长1 天前
【开题答辩全过程】以 台球俱乐部管理系统为例,包含答辩的问题和答案
java·eclipse
星火开发设计1 天前
深入浅出HDFS:分布式文件系统核心原理与实践解析
大数据·数据库·hadoop·学习·hdfs·分布式数据库·知识
Hello.Reader1 天前
Hadoop Formats 在 Flink 里复用 Hadoop InputFormat(flink-hadoop-compatibility)
大数据·hadoop·flink
橙露1 天前
大数据分析入门:Hadoop 生态系统与 Python 结合的分布式数据处理实践
hadoop·分布式·数据分析
zgl_200537792 天前
ZGLanguage 解析SQL数据血缘 之 Python + Echarts 显示SQL结构图
大数据·数据库·数据仓库·hadoop·sql·代码规范·源代码管理
飞Link2 天前
【Sqoop】Sqoop 使用教程:从原理到实战的完整指南
数据库·hadoop·sqoop
开开心心_Every2 天前
强制打字练习工具:打够百字才可退出
java·游戏·微信·eclipse·pdf·excel·语音识别