Hadoop——分布式计算MapReduce和资源调度Yarn

分布式计算

MapReduce

YARN架构


YARN集群部署


一、Hadoop安装目录下/etc/hadoop修改mapred-env配置文件,mapred-site.xml文件

二、etc/hadoop文件内,修改yarn-env.sh,yarn-site.xml

三、将配置好的文件分发到其他服务节点

bash 复制代码
start-dfs.sh

四、进程启动命令

通过jps命令查看

五、通过浏览器查看

切换到root,init 0进行关机,设定快照

提交MapReduce任务到Yarn

①、提交wordcount单词计数

Ⅰ:准备一个words.txt文件,并上传到HDFS中

bash 复制代码
vim words.txt 
hadoop fs -mkdir -p /input
hadoop fs -mkdir /output

hadoop fs -put words.txt /input/

hadoop jar /export/server/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.4.jar wordcount hdfs://node1:8020/input/ hdfs://node1:8020/output/wc  # 确保输出文件夹不存在

查看输出结果

②、圆周率

bash 复制代码
hadoop jar /export/server/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.4.jar pi 3 1000
相关推荐
孤影过客7 小时前
驯服数据巨兽:Hadoop如何重塑大数据的黄金时代
大数据·hadoop·分布式
Ama_tor9 小时前
Yarn |下载与配置+在 Excalidraw 项目中使用 Yarn
yarn·excalidraw
极光代码工作室10 小时前
基于Hadoop的日志数据分析系统设计
大数据·hadoop·python·数据分析·数据可视化
tumeng07111 天前
HDFS的架构优势与基本操作
hadoop·hdfs·架构
蓝眸少年CY1 天前
Hive - 函数、压缩与优化
数据仓库·hive·hadoop
仗剑_走天涯1 天前
Hadoop 安装
大数据·hadoop·分布式
sunxunyong2 天前
HDFS nnsdy重新配置启动
大数据·hadoop·hdfs
bukeyiwanshui2 天前
Hadoop环境搭建
大数据·hadoop·分布式
Jianghong Jian2 天前
HDFS常用的JAVA API
大数据·hadoop·hdfs
迈巴赫车主2 天前
大数据:Hadoop(MapReduce)
大数据·hadoop·mapreduce