文章目录
- [一、Hadoop 运行模式](#一、Hadoop 运行模式)
- 二、本地运行模式
一、Hadoop 运行模式
Hadoop 官方网站:http://hadoop.apache.org/
Hadoop 运行模式包括:本地模式、伪分布式模式以及完全分布式模式。
- 本地模式:单机运行,只是用来演示一下官方案例。
- 生产环境不用。
伪分布式模式:也是单机运行,但是具备 Hadoop 集群的所有功能,一台服务器模拟一个分布式的环境。个别缺钱的公司用来测试,生产环境不用。 - 完全分布式模式:多台服务器组成分布式环境。生产环境使用。
二、本地运行模式
本地运行模式(官方 WordCount)
-
创建在 hadoop-3.1.3 文件下面创建一个 wcinput 文件夹
[liudd@hadoop102 hadoop-3.1.3]$ mkdir wcinput
-
在 wcinput 文件下创建一个 word.txt 文件
进入wcinput
[liudd@hadoop102 hadoop-3.1.3]$ cd wcinput
编辑 word.txt 文件
[liudd@hadoop102 wcinput]$ vim word.txt
在文件中输入如下内容
hadoop yarn
hadoop mapreduce
liudd
liudd保存退出::wq
-
执行程序
回到 Hadoop 目录/opt/module/hadoop-3.1.3[liudd@hadoop102 hadoop-3.1.3]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount wcinput wcoutput
-
查看结果
[liudd@hadoop102 hadoop-3.1.3]$ cat wcoutput/part-r-00000
看到如下结果: