大数据学习1.5-单机Hadoop

1.修改主机信息

复制代码
vi /etc/hosts

2.修改信息如下(这里第三位一定是自己的IP 每个人都不一样)

复制代码
192.168.216.140 hadoop01
192.168.216.141 hadoop02
192.168.216.142 hadoop03

3.修改Hadoop配置信息-1进入配置信息文件

复制代码
cd /usr/local/hadoop/hadoop-2.7.1/etc/hadoop/

4.修改Hadoop配置信息-2vi hadoop-env.sh

复制代码
vi hadoop-env.sh 

追加如下信息

复制代码
JAVA_HOME=/usr/local/java/jdk1.8.0_221

5.修改Hadoop配置信息-3vi hdfs-site.xml

复制代码
vi hdfs-site.xml

追加如下信息(这里是单机 以后还需要改 先一步一步来 )

复制代码
<property>
 <name>dfs.replication</name>
 <value>2</value>
</property>
<property> 
<name>dfs.namenode.secondary.http-address</name> 
<value>hadoop01:50090</value> 
</property>

6.修改Hadoop配置信息-4vi core-site.xml

复制代码
vi core-site.xml

追加如下信息

复制代码
<property>
 <name>fs.defaultFS</name>
 <value>hdfs://hadoop01:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>  
<value>/usr/local/hadoop/hadoop-2.7.1/tmp</value>
</property>

7.修改Hadoop配置信息-5vi mapred-site.xml

首先进行一个复制

复制代码
cp mapred-site.xml.template mapred-site.xml
复制代码
vi mapred-site.xml

添加下面内容

复制代码
<property>
 <name>MapReduce.framework.name</name>
 <value>yarn</value>
</property>

8.修改Hadoop配置信息-3vi yarn-site.xml

复制代码
vi yarn-site.xml

9.生成公钥和私钥

复制代码
ssh-keygen -t rsa

然后三下回车

10.发送密钥

复制代码
ssh-copy-id hadoop01

11.格式化namenode(第一次启动格式化 以后不需要)

复制代码
 hdfs namenode -format

12.切换到hadoop文件夹

复制代码
cd /usr/local/hadoop/hadoop-2.7.1/

.

13.启动hadoop

复制代码
sbin/start-all.sh

14.查看网站

复制代码
hadoop01:50090

15.Hadoop实战-2创建input目录

复制代码
hadoop fs -mkdir /input

16.Hadoop实战-1创建work.txt并编辑

复制代码
vi word.txt

Hello Dear Firend
Good Good Study
Day Day up

17.Hadoop实战-3将word,txt放入input中

复制代码
 hadoop fs -put word.txt /input/word.txt

18.Hadoop实战-4进行单词统计

复制代码
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar wordcount /input/word.txt /output
相关推荐
xiaotao1311 小时前
02-机器学习基础: 监督学习——线性回归
学习·机器学习·线性回归
墨黎芜2 小时前
ArcGIS从入门到精通——地图符号、注记的初步使用
学习·arcgis·信息可视化
小李云雾2 小时前
FastAPI重要知识点---中间件(Middleware)
学习·程序人生·中间件·fastapi·middleware
小夏子_riotous3 小时前
Docker学习路径——3、常用命令
linux·运维·服务器·学习·docker·容器·centos
STLearner3 小时前
WSDM 2026 | 时间序列(Time Series)论文总结【预测,表示学习,因果】
大数据·论文阅读·人工智能·深度学习·学习·机器学习·数据挖掘
redaijufeng3 小时前
网络爬虫学习:应用selenium获取Edge浏览器版本号,自动下载对应版本msedgedriver,确保Edge浏览器顺利打开。
爬虫·学习·selenium
腾科IT教育3 小时前
零基础快速上岸HCIP,高效学习思路分享
学习·华为认证·hcip·hcip考试·hcip认证
23471021273 小时前
4.14 学习笔记
笔记·python·学习
醇氧3 小时前
【学习】软件过程模型全解析:从瀑布到敏捷的演进之路
学习·log4j
邪修king4 小时前
UE5 零基础入门第三弹: 碰撞与触发交互,解锁场景机关与蓝图封装(高娱乐性学习)
学习·ue5·交互