Hadoop高可用集群搭建

在三台虚拟机上搭建具有两个NameNode节点和两个ResourceManager节点的Hadoop高可用集群。步骤如下:

1.在3台虚拟机中的/export/servers目录中创建目录hadoop-HA,用于存放部署Hadoop高可用集群的Hadoop安装目录,命令如下:

2.安装Hadoop,以解压缩的方式安装Hadoop,将虚拟机liumengting1中/export/software目录中存放的Hadoop安装包安装到/export/servers/hadoop-HA目录。命令如下:

3.修改系统环境变量,将HADOOP_HOME变量的值修改为

Hadoop高可用集群的Hadoop安装目录,命令如下:

4.为了让系统环境变量文件中修改的内容生效,执行如下命令初始化系统环境变量,使修改的系统环境变量生效:

5.验证系统环境变量是否修改成功,执行如下命令,查看当前虚拟机中Hadoop的版本号

6.进入到Hadoop的安装目录下的etc/hadoop目录,修改hadoop-env.sh文件,修改内容如下:

7.修改core-site.xml文件,添加内容如下:

8.执行vi hdfs-site.xml命令,对该文件进行修改,添加内容如下:

9.执行vi mapres-site.xml命令,对该文件进行修改,添加内容如下:

  1. 执行vi yarn-site.xml命令,对该文件进行修改,添加内容如下:

11.执行vi workers命令,将配置文件中workers的内容修改如下内容:

12.分发Hadoop安装目录,将liumengting1的/export/servers/hadoop-HA/hadoop-3.3.4目录分发至虚拟机liumengting2、liumengting3的/export/servers/hadoop-HA目录,命令如下:

13.分发系统环境变量文件,使用scp命令将虚拟机liumengting1的系统环境变量文件profile分发至虚拟机liumengting2、liumengting3的/etc目录,具体命令如下:

14.为了让虚拟机liumengting2、liumengting3中系统环境变量文件中的修改的内容生效,执行如下命令初始化系统环境变量,使修改的系统环境变量生效:

15.开启完全分布模式部署的ZooKeeper

  1. 启动JournalNode,Hadoop高可用集群在进行格式化HDFS文件系统时会向Qurom Journal Manager写入EditLog,因此在格式化HDFS文件系统之前,需要分别在虚拟机Hadoop1、Hadoop2和Hadoop3中执行如下命令启动JournalNode:
  1. 启动JournalNode后,分别在2台虚拟机上执行jps命令,查看JournalNode是否成功开启,若出现JournalNode进程,则说明启动成功,具体效果如下:

18.格式化HDFS文件系统,命令如下:

19.同步NameNode,将虚拟机liumengting1存储FSImage文件的目录分发至虚拟机liumengting2存储FSImage文件的目录,在虚拟机liumengting中执行如下命令:

20.格式化ZKFC,命令如下:

21.启动HDFS,命令如下:

22.在3台虚拟机分别执行jps命令,查看3台虚拟机中运行的进程,如下图所示:

33.启动YARN

  1. 在3台虚拟机分别执行jps命令,查看3台虚拟机中运行的进程,如下图所示:

35.查看NameNode状态信息,访问如下两个地址,虚拟机liumengting1是standby状态,虚拟机liumengting2是active状态,效果如下所示:

36.查看ResourceManager,,访问如下两个地址,效果如下图所示:

37.测试主备切换,在虚拟机liumengting2中关闭状态为active的NameNode和ResourceManager,命令如下所示:

38.再次进行这四个地址的访问,效果如下:

1.在3台虚拟机中的/export/servers目录中创建目录hadoop-HA,用于存放部署Hadoop高可用集群的Hadoop安装目录,命令如下:

2.安装Hadoop,以解压缩的方式安装Hadoop,将虚拟机liumengting1中/export/software目录中存放的Hadoop安装包安装到/export/servers/hadoop-HA目录。命令如下:

3.修改系统环境变量,将HADOOP_HOME变量的值修改为

Hadoop高可用集群的Hadoop安装目录,命令如下:

4.为了让系统环境变量文件中修改的内容生效,执行如下命令初始化系统环境变量,使修改的系统环境变量生效:

5.验证系统环境变量是否修改成功,执行如下命令,查看当前虚拟机中Hadoop的版本号

6.进入到Hadoop的安装目录下的etc/hadoop目录,修改hadoop-env.sh文件,修改内容如下:

7.修改core-site.xml文件,添加内容如下:

8.执行vi hdfs-site.xml命令,对该文件进行修改,添加内容如下:

9.执行vi mapres-site.xml命令,对该文件进行修改,添加内容如下:

  1. 执行vi yarn-site.xml命令,对该文件进行修改,添加内容如下:

11.执行vi workers命令,将配置文件中workers的内容修改如下内容:

12.分发Hadoop安装目录,将liumengting1的/export/servers/hadoop-HA/hadoop-3.3.4目录分发至虚拟机liumengting2、liumengting3的/export/servers/hadoop-HA目录,命令如下:

13.分发系统环境变量文件,使用scp命令将虚拟机liumengting1的系统环境变量文件profile分发至虚拟机liumengting2、liumengting3的/etc目录,具体命令如下:

14.为了让虚拟机liumengting2、liumengting3中系统环境变量文件中的修改的内容生效,执行如下命令初始化系统环境变量,使修改的系统环境变量生效:

15.开启完全分布模式部署的ZooKeeper

  1. 启动JournalNode,Hadoop高可用集群在进行格式化HDFS文件系统时会向Qurom Journal Manager写入EditLog,因此在格式化HDFS文件系统之前,需要分别在虚拟机Hadoop1、Hadoop2和Hadoop3中执行如下命令启动JournalNode:
  1. 启动JournalNode后,分别在2台虚拟机上执行jps命令,查看JournalNode是否成功开启,若出现JournalNode进程,则说明启动成功,具体效果如下:

18.格式化HDFS文件系统,命令如下:

19.同步NameNode,将虚拟机liumengting1存储FSImage文件的目录分发至虚拟机liumengting2存储FSImage文件的目录,在虚拟机liumengting中执行如下命令:

20.格式化ZKFC,命令如下:

21.启动HDFS,命令如下:

22.在3台虚拟机分别执行jps命令,查看3台虚拟机中运行的进程,如下图所示:

33.启动YARN

  1. 在3台虚拟机分别执行jps命令,查看3台虚拟机中运行的进程,如下图所示:

35.查看NameNode状态信息,访问如下两个地址,虚拟机liumengting1是standby状态,虚拟机liumengting2是active状态,效果如下所示:

36.查看ResourceManager,,访问如下两个地址,效果如下图所示:

37.测试主备切换,在虚拟机liumengting2中关闭状态为active的NameNode和ResourceManager,命令如下所示:

38.再次进行这四个地址的访问,效果如下:

相关推荐
PP东几秒前
Flowable学习(二)——Flowable概念学习
java·后端·学习·flowable
ManThink Technology6 分钟前
如何使用EBHelper 简化EdgeBus的代码编写?
java·前端·网络
invicinble10 分钟前
springboot的核心实现机制原理
java·spring boot·后端
人道领域18 分钟前
SSM框架从入门到入土(AOP面向切面编程)
java·开发语言
qq_124987075333 分钟前
基于Hadoop的信贷风险评估的数据可视化分析与预测系统的设计与实现(源码+论文+部署+安装)
大数据·人工智能·hadoop·分布式·信息可视化·毕业设计·计算机毕业设计
大模型玩家七七38 分钟前
梯度累积真的省显存吗?它换走的是什么成本
java·javascript·数据库·人工智能·深度学习
A星空1231 小时前
一、Linux嵌入式的I2C驱动开发
linux·c++·驱动开发·i2c
释怀不想释怀1 小时前
Linux环境变量
linux·运维·服务器
zzzsde1 小时前
【Linux】进程(4):进程优先级&&调度队列
linux·运维·服务器
CodeToGym1 小时前
【Java 办公自动化】Apache POI 入门:手把手教你实现 Excel 导入与导出
java·apache·excel