Hadoop3.2.2伪分布式搭建

本次安装的操作系统是Kylin X86。

  1. 查看JDK是否安装
bash 复制代码
[root@ck02 ~]# java -version
openjdk version "1.8.0_292"
OpenJDK Runtime Environment Bisheng (build 1.8.0_292-b10)
OpenJDK 64-Bit Server VM Bisheng (build 25.292-b10, mixed mode)
#如果没有安装JDK,使用yum 安装
yum search java | grep jdk  #查看JDK版本
yum install -y java-1.8.0-openjdk-devel #安装JDK8
  1. 下载安装包

    https://archive.apache.org/dist/hadoop/common/官网下载对应的版本

  2. 安装Hadoop3.2.2

bash 复制代码
#在/data下创建Hadoop目录
[root@ck02 data]# mkdir hadoop
[root@ck02 data]# cd hadoop

# 把安装包上传到/data/hadoop目录下,解压
[root@ck02 hadoop]# tar -zvxf hadoop-3.2.2.tar.gz
[root@ck02 hadoop]# cd hadoop-3.2.2
[root@ck02 hadoop-3.2.2]# pwd #查看安装目录 /data/hadoop/hadoop-3.2.2

#修改环境变量
[root@ck02 hadoop-3.2.2]# vim /etc/profile #新增下面两行
export HADOOP_HOME=/data/hadoop/hadoop-3.2.2
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
[root@ck02 hadoop-3.2.2]# source /etc/profile

#修改Hadoop配置文件
[root@ck02 hadoop-3.2.2]# cd etc/hadoop/
[root@ck02 hadoop]# vim hadoop-env.sh 
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.292.b10-8.ky10.x86_64
export HADOOP_HOME=/data/hadoop/hadoop-3.2.2
export HADOOP_CONF_DIR=/data/hadoop/hadoop-3.2.2/etc/hadoop

[root@ck02 hadoop]# vim yarn-site.xml 
<configuration>
<!-- Site specific YARN configuration properties -->
 <property>
      <name>yarn.nodemanager.aux-services</name>
      <value>mapreduce_shuffle</value>
    </property>
      <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>ck02</value>  
        <!-- 这里改成自己的主机名 -->
    </property>
</configuration>

[root@ck02 hadoop]# vim mapred-site.xml
<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
    <property>
        <name>mapreduce.application.classpath</name>
        <value>$HADOOP_HOME/share/hadoop/mapreduce/*:$HADOOP_HOME/share/hadoop/mapreduce/lib/*</value>
    </property>
</configuration>

[root@ck02 hadoop]# vim core-site.xml 
<configuration>
    <property>
      <name>fs.defaultFS</name>
      <value>hdfs://ck02:8020</value>
    </property>
    <property>
      <name>hadoop.tmp.dir</name>
      <value>/data/hp/temp</value>
    </property>
    <property>
      <name>hadoop.proxyuser.hadoop.hosts</name>
      <value>*</value>
    </property>
    <property>
      <name>hadoop.proxyuser.hadoop.groups</name>
      <value>*</value>
    </property>
</configuration>

[root@ck02 hadoop]# vim hdfs-site.xml 
<configuration>
   <property>
        <name>dfs.replication</name>
        <value>1</value>
        <!-- 副本数,生产默认3副本,测试改成1 -->
    </property>
    <property>
      <name>dfs.namenode.name.dir</name>
      <value>/data/hp/hdfs/name</value>
    </property>
    <property>
      <name>dfs.datanode.data.dir</name>
      <value>/data/hp/hdfs/data</value>
    </property>
</configuration>

#创建hadoop用户,使用hadoop用户启动服务
[root@ck02 hadoop]# useradd hadoop
[root@ck02 hadoop]# passwd hadoop 
#给Hadoop用户权限
[root@ck02 hadoop]# chown -R hadoop:hadoop /data/hadoop/hadoop-3.2.2
#创建hadoop.tmp.dir
[root@ck02 hadoop]# mkdir -p /data/hp/temp 
[root@ck02 hadoop]# mkdir -p /data/hp/temp 
[root@ck02 hadoop]# chown -R  hadoop:hadoop /data/hp/

#切换hadoop用户启动
[root@ck02 hadoop]# su - hadoop
#配置服务器自身的ssh免密认证,为了让Hadoop脚本无交互执行
[hadoop@ck02 ~]$ ssh-keygen -t rsa
[hadoop@ck02 ~]$ cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys
#启动集群前格式化NameNode
[hadoop@ck02 ~]$ hdfs namenode -format
#启动集群服务
[hadoop@ck02 ~]$ start-all.sh 
[hadoop@ck02 ~]$ jps
3327073 SecondaryNameNode
3326740 DataNode
3326570 NameNode
3327499 NodeManager
3327337 ResourceManager
3999281 Jps

#验证集群
[hadoop@ck02 ~]$ hdfs dfs -put .bashrc /
[hadoop@ck02 ~]$ hdfs dfs -ls /
-rw-r--r--   1 hadoop supergroup        138 2026-02-02 14:44 /.bashrc

#登录HDFS WebUI查看,默认端口是9870
http://ck02:9870

登录yarn WebUI查看,默认端口8088。

http://ck02:8088

后续会出hive3.1.2的安装~

相关推荐
Java开发的小李20 小时前
SpringBoot + Redis 实现分布式 Session 共享(解决多实例登录状态丢失问题)
spring boot·redis·分布式
Promise微笑20 小时前
2026年国产替代油介损测试仪:油介损全场景解决方案与技术演进
大数据·网络·人工智能
workflower20 小时前
具身智能行业应用-生活服务业
大数据·人工智能·机器人·动态规划·生活
志栋智能1 天前
超自动化安全:构建智能安全运营的核心引擎
大数据·运维·服务器·数据库·安全·自动化·产品运营
tsyjjOvO1 天前
分布式事务 Seata 与链路追踪 SkyWalking 全解析
分布式·skywalking
xiaoduo AI1 天前
客服机器人非工作时间能休眠?智能Agent开放平台定时唤醒,无人值守省资源?
大数据·人工智能·机器人
好赞科技1 天前
深度测评2026年精选美发预约小程序排行榜 革新预约新体验 修订
大数据·微信小程序
集和诚JHCTECH1 天前
BRAV-7120加持,让有毒有害气体无处遁形
大数据·人工智能·嵌入式硬件
互联网志1 天前
加速高校科技成果转化 赋能实体经济高质量发展
大数据·人工智能·物联网
李可以量化1 天前
DeepSeek 量化交易实战:用标准化提示词模板实现 AI 辅助交易决策
大数据·数据库·人工智能