基于伪分布式模式部署Hadoop集群

1.上传Hadoop安装包

在/export/software目录下使用rz命令上传Hadoop安装包

2.创建目录

在/export/servers目录下创建wfb-hadoop目录,用于存放Hadoop的安装目录,命令如下:

mkdir -p /export/servers/wfb-hadoop

3.安装Hadoop

1)将Hadoop安装到/export/servers/wfb-hadoop目录,命令如下:

tar -zxvf /export/software/Hadoop-3.3.4.tar.gz -C /export/servers/wfb-hadoop

2)安装完成之后,进入到安装目录/export/servers/wfb-hadoop/Hadoop-3.3.4,并执行ll命令查 看Hadoop安装目录中的所有文件

4.验证Hadoop是否安装成功

在安装目录执行bin/Hadoop version命令查看Hadoop版本号,来验证是否安装成功

5.修改Hadoop配置文件

进入安装目录下的/etc/hadoop目录

1)使用vi Hadoop-env.sh命令进行编辑,在该文件中添加如下内容:

export JAVA_HOME=/export/servers/jdk1.8.0_171

export HDFS_NAMENODE_USER=root

export HDFS_DATANODE_USER=root

export HDFS_SECONDARYNAMENODE_USER=root

export YARN_RESOURCEMANAGER_USER=root

export YARN_NODEMANAGER_USER=root

2)执行vi core-site.xml命令进行编辑,在<configuration>标签中添加如下内容:

<property>

<name>fs.defaultFS</name>

<value>hdfs://hadoop1:9000</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>/export/data/hadoop-wfb-3.3.4</value>

</property>

<property>

<name>hadoop.http.staticuser.user</name>

<value>root</value>

</property>

<property>

<name>hadoop.proxyuser.root.hosts</name>

<value>*</value>

</property>

<property>

<name>hadoop.proxyuser.root.groups</name>

<value>*</value>

</property>

<property>

<name>fs.trash.interval</name>

<value>1440</value>

</property>

3)执行vi hdfs-site.xml命令进行编辑,在文件的<configuration>标签中添加如下内容:

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

<property>

<name>dfs.namenode.secondary.http-address</name>

<value>hadoop1:9868</value>

</property>

4)执行vi mapred-site.xml命令进行编辑,在文件的<configuration>标签中添加如下内容:

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

<property>

<name>mapreduce.jobhistory.address</name>

<value>hadoop1:10020</value>

</property>

<property>

<name>mapreduce.jobhistory.webapp.address</name>

<value>hadoop1:19888</value>

</property>

<property>

<name>yarn.app.mapreduce.am.env</name>

<value>HADOOP_MAPRED_HOME=/export/servers/wfb-hadoop/hadoop-3.3.4</value>

</property>

<property>

<name>marpreduce.map.env</name>

<value>HADOOP_MAPRED_HOME=/export/servers/wfb_hadoop/hadoop-3.3.4</value>

</property>

<property>

<name>mapreduce.reduce.env</name>

<value>HADOOP_MAPRED_HOME=/export/servers/wfb-hadoop/hadoop-3.3.4</value>

</property>

5)执行vi yarn-site.xml命令进行编辑,在文件的<configuration>标签中添加如下内容:

<property>

<name>yarn.resorcemanager.hostname</name>

<value>hadoop1</value>

</property>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

<name>yarn.nodemanager.pmem-check-enabled</name>

<value>false</value>

</property>

<property>

<name>yarn.nodemanager.vmem-check-enabled</name>

<value>false</value>

</property>

<property>

<name>yarn.log-aggregation-enable</name>

<value>true</value>

</property>

<property>

<name>yarn.log.server.url</name>

<value>http://hadoop1:19888/jobhistory/logs\</value>

</property>

<property>

<name>yarn.log-aggregation.retain-seconds</name>

<value>604800</value>

</property>

6)在安装目录虚下的/etc/hadoop目录执行vi workers命令,配置Hadoop从节点运行的服务器,将workers文件的默认内容改为hadoop1

6.格式化HDFS文件系统

在安装目录下执行如下命令,进行HDFS格式化(我已经进行格式化了,不再展示命令执行结果),出现successfully formatted说明格式化成功

bin/hdfs namenode -format

7.启动Hadoop

在安装目录下执行下列命令,启动HDFS和YARN

sbin/start-dfs.sh

sbin/start-yarn.sh

8.查看Hadoop运行状态

使用jps命令查看HDFS和YARN的相关服务

相关推荐
qq_124987075312 小时前
基于Hadoop的信贷风险评估的数据可视化分析与预测系统的设计与实现(源码+论文+部署+安装)
大数据·人工智能·hadoop·分布式·信息可视化·毕业设计·计算机毕业设计
Coder_Boy_14 小时前
基于Spring AI的分布式在线考试系统-事件处理架构实现方案
人工智能·spring boot·分布式·spring
十月南城14 小时前
Hive与离线数仓方法论——分层建模、分区与桶的取舍与查询代价
数据仓库·hive·hadoop
袁煦丞 cpolar内网穿透实验室15 小时前
远程调试内网 Kafka 不再求运维!cpolar 内网穿透实验室第 791 个成功挑战
运维·分布式·kafka·远程工作·内网穿透·cpolar
人间打气筒(Ada)15 小时前
GlusterFS实现KVM高可用及热迁移
分布式·虚拟化·kvm·高可用·glusterfs·热迁移
xu_yule15 小时前
Redis存储(15)Redis的应用_分布式锁_Lua脚本/Redlock算法
数据库·redis·分布式
B站计算机毕业设计超人16 小时前
计算机毕业设计Hadoop+Spark+Hive招聘推荐系统 招聘大数据分析 大数据毕业设计(源码+文档+PPT+ 讲解)
大数据·hive·hadoop·python·spark·毕业设计·课程设计
B站计算机毕业设计超人16 小时前
计算机毕业设计hadoop+spark+hive交通拥堵预测 交通流量预测 智慧城市交通大数据 交通客流量分析(源码+LW文档+PPT+讲解视频)
大数据·hive·hadoop·python·spark·毕业设计·课程设计
AI架构师小马16 小时前
Hive调优手册:从入门到精通的完整指南
数据仓库·hive·hadoop·ai
数据架构师的AI之路16 小时前
深入了解大数据领域Hive的HQL语言特性
大数据·hive·hadoop·ai