Hadoop高可用集群搭建

在三台虚拟机上搭建具有两个NameNode节点和两个ResourceManager节点的Hadoop高可用集群。步骤如下:

1.在3台虚拟机中的/export/servers目录中创建目录hadoop-HA,用于存放部署Hadoop高可用集群的Hadoop安装目录,命令如下:

2.安装Hadoop,以解压缩的方式安装Hadoop,将虚拟机liumengting1中/export/software目录中存放的Hadoop安装包安装到/export/servers/hadoop-HA目录。命令如下:

3.修改系统环境变量,将HADOOP_HOME变量的值修改为

Hadoop高可用集群的Hadoop安装目录,命令如下:

4.为了让系统环境变量文件中修改的内容生效,执行如下命令初始化系统环境变量,使修改的系统环境变量生效:

5.验证系统环境变量是否修改成功,执行如下命令,查看当前虚拟机中Hadoop的版本号

6.进入到Hadoop的安装目录下的etc/hadoop目录,修改hadoop-env.sh文件,修改内容如下:

7.修改core-site.xml文件,添加内容如下:

8.执行vi hdfs-site.xml命令,对该文件进行修改,添加内容如下:

9.执行vi mapres-site.xml命令,对该文件进行修改,添加内容如下:

  1. 执行vi yarn-site.xml命令,对该文件进行修改,添加内容如下:

11.执行vi workers命令,将配置文件中workers的内容修改如下内容:

12.分发Hadoop安装目录,将liumengting1的/export/servers/hadoop-HA/hadoop-3.3.4目录分发至虚拟机liumengting2、liumengting3的/export/servers/hadoop-HA目录,命令如下:

13.分发系统环境变量文件,使用scp命令将虚拟机liumengting1的系统环境变量文件profile分发至虚拟机liumengting2、liumengting3的/etc目录,具体命令如下:

14.为了让虚拟机liumengting2、liumengting3中系统环境变量文件中的修改的内容生效,执行如下命令初始化系统环境变量,使修改的系统环境变量生效:

15.开启完全分布模式部署的ZooKeeper

  1. 启动JournalNode,Hadoop高可用集群在进行格式化HDFS文件系统时会向Qurom Journal Manager写入EditLog,因此在格式化HDFS文件系统之前,需要分别在虚拟机Hadoop1、Hadoop2和Hadoop3中执行如下命令启动JournalNode:
  1. 启动JournalNode后,分别在2台虚拟机上执行jps命令,查看JournalNode是否成功开启,若出现JournalNode进程,则说明启动成功,具体效果如下:

18.格式化HDFS文件系统,命令如下:

19.同步NameNode,将虚拟机liumengting1存储FSImage文件的目录分发至虚拟机liumengting2存储FSImage文件的目录,在虚拟机liumengting中执行如下命令:

20.格式化ZKFC,命令如下:

21.启动HDFS,命令如下:

22.在3台虚拟机分别执行jps命令,查看3台虚拟机中运行的进程,如下图所示:

33.启动YARN

  1. 在3台虚拟机分别执行jps命令,查看3台虚拟机中运行的进程,如下图所示:

35.查看NameNode状态信息,访问如下两个地址,虚拟机liumengting1是standby状态,虚拟机liumengting2是active状态,效果如下所示:

36.查看ResourceManager,,访问如下两个地址,效果如下图所示:

37.测试主备切换,在虚拟机liumengting2中关闭状态为active的NameNode和ResourceManager,命令如下所示:

38.再次进行这四个地址的访问,效果如下:

1.在3台虚拟机中的/export/servers目录中创建目录hadoop-HA,用于存放部署Hadoop高可用集群的Hadoop安装目录,命令如下:

2.安装Hadoop,以解压缩的方式安装Hadoop,将虚拟机liumengting1中/export/software目录中存放的Hadoop安装包安装到/export/servers/hadoop-HA目录。命令如下:

3.修改系统环境变量,将HADOOP_HOME变量的值修改为

Hadoop高可用集群的Hadoop安装目录,命令如下:

4.为了让系统环境变量文件中修改的内容生效,执行如下命令初始化系统环境变量,使修改的系统环境变量生效:

5.验证系统环境变量是否修改成功,执行如下命令,查看当前虚拟机中Hadoop的版本号

6.进入到Hadoop的安装目录下的etc/hadoop目录,修改hadoop-env.sh文件,修改内容如下:

7.修改core-site.xml文件,添加内容如下:

8.执行vi hdfs-site.xml命令,对该文件进行修改,添加内容如下:

9.执行vi mapres-site.xml命令,对该文件进行修改,添加内容如下:

  1. 执行vi yarn-site.xml命令,对该文件进行修改,添加内容如下:

11.执行vi workers命令,将配置文件中workers的内容修改如下内容:

12.分发Hadoop安装目录,将liumengting1的/export/servers/hadoop-HA/hadoop-3.3.4目录分发至虚拟机liumengting2、liumengting3的/export/servers/hadoop-HA目录,命令如下:

13.分发系统环境变量文件,使用scp命令将虚拟机liumengting1的系统环境变量文件profile分发至虚拟机liumengting2、liumengting3的/etc目录,具体命令如下:

14.为了让虚拟机liumengting2、liumengting3中系统环境变量文件中的修改的内容生效,执行如下命令初始化系统环境变量,使修改的系统环境变量生效:

15.开启完全分布模式部署的ZooKeeper

  1. 启动JournalNode,Hadoop高可用集群在进行格式化HDFS文件系统时会向Qurom Journal Manager写入EditLog,因此在格式化HDFS文件系统之前,需要分别在虚拟机Hadoop1、Hadoop2和Hadoop3中执行如下命令启动JournalNode:
  1. 启动JournalNode后,分别在2台虚拟机上执行jps命令,查看JournalNode是否成功开启,若出现JournalNode进程,则说明启动成功,具体效果如下:

18.格式化HDFS文件系统,命令如下:

19.同步NameNode,将虚拟机liumengting1存储FSImage文件的目录分发至虚拟机liumengting2存储FSImage文件的目录,在虚拟机liumengting中执行如下命令:

20.格式化ZKFC,命令如下:

21.启动HDFS,命令如下:

22.在3台虚拟机分别执行jps命令,查看3台虚拟机中运行的进程,如下图所示:

33.启动YARN

  1. 在3台虚拟机分别执行jps命令,查看3台虚拟机中运行的进程,如下图所示:

35.查看NameNode状态信息,访问如下两个地址,虚拟机liumengting1是standby状态,虚拟机liumengting2是active状态,效果如下所示:

36.查看ResourceManager,,访问如下两个地址,效果如下图所示:

37.测试主备切换,在虚拟机liumengting2中关闭状态为active的NameNode和ResourceManager,命令如下所示:

38.再次进行这四个地址的访问,效果如下:

相关推荐
带鱼吃猫7 分钟前
Linux系统:ext2文件系统的核心概念和结构
linux·运维·服务器
贺函不是涵9 分钟前
【沉浸式求职学习day43】【Java面试题精选3】
java·开发语言·学习
qwer5558813 分钟前
linux-----------------库制作与原理(下)
linux·运维·服务器
xiaobin8899915 分钟前
matlab官方免费下载安装超详细教程2025最新matlab安装教程(MATLAB R2024b)
java·开发语言·其他·matlab
m0_5195231016 分钟前
Linux——UDP/TCP协议理论
linux·tcp/ip·udp
Freedom℡33 分钟前
Spark,连接MySQL数据库,添加数据,读取数据
数据库·hadoop·spark
小伍_Five35 分钟前
spark数据处理练习题详解【下】
java·大数据·spark·scala
xmweisi0241 分钟前
【Linux】ssh命令 – 安全的远程连接服务
linux·安全·ssh
Pacify_The_North1 小时前
【进程控制二】进程替换和bash解释器
linux·c语言·开发语言·算法·ubuntu·centos·bash
ephemerals__1 小时前
【Linux】简易版Shell实现(附源码)
linux·运维·chrome