大数据学习1.5-单机Hadoop

1.修改主机信息

复制代码
vi /etc/hosts

2.修改信息如下(这里第三位一定是自己的IP 每个人都不一样)

复制代码
192.168.216.140 hadoop01
192.168.216.141 hadoop02
192.168.216.142 hadoop03

3.修改Hadoop配置信息-1进入配置信息文件

复制代码
cd /usr/local/hadoop/hadoop-2.7.1/etc/hadoop/

4.修改Hadoop配置信息-2vi hadoop-env.sh

复制代码
vi hadoop-env.sh 

追加如下信息

复制代码
JAVA_HOME=/usr/local/java/jdk1.8.0_221

5.修改Hadoop配置信息-3vi hdfs-site.xml

复制代码
vi hdfs-site.xml

追加如下信息(这里是单机 以后还需要改 先一步一步来 )

复制代码
<property>
 <name>dfs.replication</name>
 <value>2</value>
</property>
<property> 
<name>dfs.namenode.secondary.http-address</name> 
<value>hadoop01:50090</value> 
</property>

6.修改Hadoop配置信息-4vi core-site.xml

复制代码
vi core-site.xml

追加如下信息

复制代码
<property>
 <name>fs.defaultFS</name>
 <value>hdfs://hadoop01:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>  
<value>/usr/local/hadoop/hadoop-2.7.1/tmp</value>
</property>

7.修改Hadoop配置信息-5vi mapred-site.xml

首先进行一个复制

复制代码
cp mapred-site.xml.template mapred-site.xml
复制代码
vi mapred-site.xml

添加下面内容

复制代码
<property>
 <name>MapReduce.framework.name</name>
 <value>yarn</value>
</property>

8.修改Hadoop配置信息-3vi yarn-site.xml

复制代码
vi yarn-site.xml

9.生成公钥和私钥

复制代码
ssh-keygen -t rsa

然后三下回车

10.发送密钥

复制代码
ssh-copy-id hadoop01

11.格式化namenode(第一次启动格式化 以后不需要)

复制代码
 hdfs namenode -format

12.切换到hadoop文件夹

复制代码
cd /usr/local/hadoop/hadoop-2.7.1/

.

13.启动hadoop

复制代码
sbin/start-all.sh

14.查看网站

复制代码
hadoop01:50090

15.Hadoop实战-2创建input目录

复制代码
hadoop fs -mkdir /input

16.Hadoop实战-1创建work.txt并编辑

复制代码
vi word.txt

Hello Dear Firend
Good Good Study
Day Day up

17.Hadoop实战-3将word,txt放入input中

复制代码
 hadoop fs -put word.txt /input/word.txt

18.Hadoop实战-4进行单词统计

复制代码
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar wordcount /input/word.txt /output
相关推荐
Dxy123931021636 分钟前
Elasticsearch 索引与映射:为你的数据打造一个“智能仓库”
大数据·elasticsearch·搜索引擎
奶茶精Gaaa39 分钟前
工具分享--json在线转换工具
学习
wdfk_prog1 小时前
[Linux]学习笔记系列 -- [drivers][I2C]I2C
linux·笔记·学习
盐焗西兰花1 小时前
鸿蒙学习实战之路-Reader Kit自定义字体最佳实践
学习·华为·harmonyos
岁岁种桃花儿1 小时前
Kafka从入门到上天系列第一篇:kafka的安装和启动
大数据·中间件·kafka
Apache Flink2 小时前
Apache Flink Agents 0.2.0 发布公告
大数据·flink·apache
近津薪荼2 小时前
dfs专题5——(二叉搜索树中第 K 小的元素)
c++·学习·算法·深度优先
永霖光电_UVLED2 小时前
打造更优异的 UVB 激光器
大数据·制造·量子计算
m0_466525292 小时前
绿盟科技风云卫AI安全能力平台成果重磅发布
大数据·数据库·人工智能·安全
晟诺数字人2 小时前
2026年海外直播变革:数字人如何改变游戏规则
大数据·人工智能·产品运营