Hadoop3.2.2伪分布式搭建

本次安装的操作系统是Kylin X86。

  1. 查看JDK是否安装
bash 复制代码
[root@ck02 ~]# java -version
openjdk version "1.8.0_292"
OpenJDK Runtime Environment Bisheng (build 1.8.0_292-b10)
OpenJDK 64-Bit Server VM Bisheng (build 25.292-b10, mixed mode)
#如果没有安装JDK,使用yum 安装
yum search java | grep jdk  #查看JDK版本
yum install -y java-1.8.0-openjdk-devel #安装JDK8
  1. 下载安装包

    https://archive.apache.org/dist/hadoop/common/官网下载对应的版本

  2. 安装Hadoop3.2.2

bash 复制代码
#在/data下创建Hadoop目录
[root@ck02 data]# mkdir hadoop
[root@ck02 data]# cd hadoop

# 把安装包上传到/data/hadoop目录下,解压
[root@ck02 hadoop]# tar -zvxf hadoop-3.2.2.tar.gz
[root@ck02 hadoop]# cd hadoop-3.2.2
[root@ck02 hadoop-3.2.2]# pwd #查看安装目录 /data/hadoop/hadoop-3.2.2

#修改环境变量
[root@ck02 hadoop-3.2.2]# vim /etc/profile #新增下面两行
export HADOOP_HOME=/data/hadoop/hadoop-3.2.2
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
[root@ck02 hadoop-3.2.2]# source /etc/profile

#修改Hadoop配置文件
[root@ck02 hadoop-3.2.2]# cd etc/hadoop/
[root@ck02 hadoop]# vim hadoop-env.sh 
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.292.b10-8.ky10.x86_64
export HADOOP_HOME=/data/hadoop/hadoop-3.2.2
export HADOOP_CONF_DIR=/data/hadoop/hadoop-3.2.2/etc/hadoop

[root@ck02 hadoop]# vim yarn-site.xml 
<configuration>
<!-- Site specific YARN configuration properties -->
 <property>
      <name>yarn.nodemanager.aux-services</name>
      <value>mapreduce_shuffle</value>
    </property>
      <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>ck02</value>  
        <!-- 这里改成自己的主机名 -->
    </property>
</configuration>

[root@ck02 hadoop]# vim mapred-site.xml
<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
    <property>
        <name>mapreduce.application.classpath</name>
        <value>$HADOOP_HOME/share/hadoop/mapreduce/*:$HADOOP_HOME/share/hadoop/mapreduce/lib/*</value>
    </property>
</configuration>

[root@ck02 hadoop]# vim core-site.xml 
<configuration>
    <property>
      <name>fs.defaultFS</name>
      <value>hdfs://ck02:8020</value>
    </property>
    <property>
      <name>hadoop.tmp.dir</name>
      <value>/data/hp/temp</value>
    </property>
    <property>
      <name>hadoop.proxyuser.hadoop.hosts</name>
      <value>*</value>
    </property>
    <property>
      <name>hadoop.proxyuser.hadoop.groups</name>
      <value>*</value>
    </property>
</configuration>

[root@ck02 hadoop]# vim hdfs-site.xml 
<configuration>
   <property>
        <name>dfs.replication</name>
        <value>1</value>
        <!-- 副本数,生产默认3副本,测试改成1 -->
    </property>
    <property>
      <name>dfs.namenode.name.dir</name>
      <value>/data/hp/hdfs/name</value>
    </property>
    <property>
      <name>dfs.datanode.data.dir</name>
      <value>/data/hp/hdfs/data</value>
    </property>
</configuration>

#创建hadoop用户,使用hadoop用户启动服务
[root@ck02 hadoop]# useradd hadoop
[root@ck02 hadoop]# passwd hadoop 
#给Hadoop用户权限
[root@ck02 hadoop]# chown -R hadoop:hadoop /data/hadoop/hadoop-3.2.2
#创建hadoop.tmp.dir
[root@ck02 hadoop]# mkdir -p /data/hp/temp 
[root@ck02 hadoop]# mkdir -p /data/hp/temp 
[root@ck02 hadoop]# chown -R  hadoop:hadoop /data/hp/

#切换hadoop用户启动
[root@ck02 hadoop]# su - hadoop
#配置服务器自身的ssh免密认证,为了让Hadoop脚本无交互执行
[hadoop@ck02 ~]$ ssh-keygen -t rsa
[hadoop@ck02 ~]$ cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys
#启动集群前格式化NameNode
[hadoop@ck02 ~]$ hdfs namenode -format
#启动集群服务
[hadoop@ck02 ~]$ start-all.sh 
[hadoop@ck02 ~]$ jps
3327073 SecondaryNameNode
3326740 DataNode
3326570 NameNode
3327499 NodeManager
3327337 ResourceManager
3999281 Jps

#验证集群
[hadoop@ck02 ~]$ hdfs dfs -put .bashrc /
[hadoop@ck02 ~]$ hdfs dfs -ls /
-rw-r--r--   1 hadoop supergroup        138 2026-02-02 14:44 /.bashrc

#登录HDFS WebUI查看,默认端口是9870
http://ck02:9870

登录yarn WebUI查看,默认端口8088。

http://ck02:8088

后续会出hive3.1.2的安装~

相关推荐
淘矿人6 小时前
Claude辅助DevOps实践
java·大数据·运维·人工智能·算法·bug·devops
SeaTunnel6 小时前
AI 让 SeaTunnel 读源码和调试过时了吗?
大数据·数据库·人工智能·apache·seatunnel·数据同步
WL_Aurora7 小时前
MapReduce【Shuffle-Combiner】
大数据·mapreduce
Mortalbreeze7 小时前
深度理解文件系统 ---- 从磁盘存储到内核存储
大数据·linux·数据库
Bechamz8 小时前
大数据开发学习Day36
大数据·学习
C-20028 小时前
基于 JumpServer 容器化部署 ES 集群
大数据·elasticsearch·搜索引擎
captain_AIouo8 小时前
降本增效突围,Captain AI助力Ozon商家提升盈利空间
大数据·人工智能·经验分享·aigc
敖正炀10 小时前
高并发系统的降级预案与容错策略
分布式·架构
敖正炀10 小时前
稳定性监控与告警体系:SLI/SLO/SLA 实践
分布式·架构
黎阳之光10 小时前
视听融合新范式!黎阳之光打破视觉边界,声影协同赋能全域智慧管控
大数据·人工智能·物联网·算法·数字孪生