hadoop-3.4.1 单机伪部署

下载并安装软件

上传安装软件到服务器

解压安装:tar -xzvf hadoop-3.4.1.tar.gz -C /opt/module/

Hadoop配置

  1. 配置hadoop环境变量:

    bash 复制代码
    sudo vim /etc/profile.d/myprofile.sh
    
    #HADOOP_HOME
    export HADOOP_HOME=/opt/module/hadoop-3.4.1
    export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
    export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
    export HADOOP_CLASSPATH=$(hadoop classpath)

    应用变更: source /etc/profile

  2. 配置hadoop使用的JAVA环境

    bash 复制代码
    sudo vim $HADOOP_HOME/etc/hadoop/hadoop-env.sh
    
    # 配置Hadoop使用的JAVA路径
    export JAVA_HOME=/opt/module/jdk-17.0.10
  3. 配置core-site.xml

    bash 复制代码
    vim $HADOOP_HOME/etc/hadoop/core-site.xml
    XML 复制代码
    <configuration>
      <property>
        <name>fs.defaultFS</name>
        <value>hdfs://mydoris:9000</value>
        <description>NameNode的地址</description>
      </property>
      <property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/data/hadoop/tmp</value>
        <description>hadoop数据存储目录</description>
      </property>
    </configuration>
  4. 配置hdfs-site.xml

    bash 复制代码
    vim  $HADOOP_HOME/etc/hadoop/hdfs-site.xml
    XML 复制代码
    <configuration>
      <property>
        <name>dfs.replication</name>
        <value>1</value>  <!-- 单机只需1副本 -->
      </property>
      <property>
        <name>dfs.namenode.name.dir</name>
        <value>file://${hadoop.tmp.dir}/dfs/name</value>
      </property>
      <property>
        <name>dfs.datanode.data.dir</name>
        <value>file://${hadoop.tmp.dir}/dfs/data</value>
      </property>
    </configuration>
  5. 配置 yarn-site.xml

    bash 复制代码
    vim $HADOOP_HOME/etc/hadoop/yarn-site.xml
    XML 复制代码
    <configuration>
      <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
      </property>
      <property>
        <name>yarn.nodemanager.env-whitelist</name>
        <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
      </property>
    </configuration>

配置mapred-site.xml

bash 复制代码
vim $HADOOP_HOME/etc/hadoop/mapred-site.xml
XML 复制代码
<configuration>
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>
</configuration>
  1. 解决Hadoop 3.4与JDK 17冲突问题

    bash 复制代码
    # 编辑 Hadoop 环境配置文件
    cd /opt/module/hadoop-3.4.1
    vim etc/hadoop/hadoop-env.sh
    
    # 文件末尾 添加以下内容:
    # Fix for JDK 17+ module access restrictions
    export HADOOP_OPTS="$HADOOP_OPTS --add-opens=java.base/java.lang=ALL-UNNAMED"
    export HADOOP_OPTS="$HADOOP_OPTS --add-opens=java.base/java.lang.reflect=ALL-UNNAMED"
    export HADOOP_OPTS="$HADOOP_OPTS --add-opens=java.base/java.net=ALL-UNNAMED"
    export HADOOP_OPTS="$HADOOP_OPTS --add-opens=java.base/java.util=ALL-UNNAMED"
    export HADOOP_OPTS="$HADOOP_OPTS --add-opens=java.base/sun.nio.ch=ALL-UNNAMED"
    export HADOOP_OPTS="$HADOOP_OPTS --add-opens=java.base/java.nio=ALL-UNNAMED"
    export HADOOP_OPTS="$HADOOP_OPTS --add-opens=java.base/java.util.concurrent=ALL-UNNAMED"
    
    # 若已经启动过hdfs,需要清理并重启hadoop
    # 停止
    ./sbin/stop-yarn.sh
    ./sbin/stop-dfs.sh
    
    # 删除临时数据(避免 clusterID 冲突)
    rm -rf /tmp/hadoop-*
    
    # 重新格式化(使用 JDK 17)
    hdfs namenode -format
    
    # 启动
    ./sbin/start-dfs.sh
    ./sbin/start-yarn.sh

启动Hadoop服务

格式化 NameNode(首次)

bash 复制代码
./bin/hdfs namenode -format

启动 HDFS + YARN

bash 复制代码
./sbin/start-dfs.sh
./sbin/start-yarn.sh

验证服务

bash 复制代码
jps


4.

查看启动日志

  1. 日志路径:/opt/module/hadoop-3.4.1/logs/

访问 WEB UI

  1. HDFS: http://mydoris:9870

  2. YARN: http://mydoris:8088
复制代码
### 测试 HDFS 读写
复制代码
```bash
./bin/hadoop fs -mkdir /t001
./bin/hadoop fs -put ~/.bashrc /t001/
./bin/hadoop fs -ls /t001
```

![](https://i-blog.csdnimg.cn/direct/48541ffb32e44cd48e49fdf8d537abda.png)![](https://i-blog.csdnimg.cn/direct/7846ac49d679456a8365a1789034efcd.png)
相关推荐
齐齐大魔王6 小时前
linux-僵死进程处理
linux·运维·服务器
wuminyu9 小时前
专家视角看Java字节码加载与存储指令机制
java·linux·c语言·jvm·c++
.小小陈.9 小时前
Linux 线程概念与控制:从底层原理到实战应用
linux·运维·jvm
网络工程小王9 小时前
【LangChain 大模型6大调用指南】调用大模型篇
linux·运维·服务器·人工智能·学习
TDengine (老段)9 小时前
从施工监测到运营预警,桥科院用 TDengine 提升桥梁数据管理能力
大数据·数据库·物联网·时序数据库·tdengine·涛思数据
wangbing11259 小时前
各linux版本的包管理命令
linux·运维·服务器
宁波鹿语心理9 小时前
无条件的在场:一项极简亲子依恋修复练习的机制分析与实证观察
大数据
Joseph Cooper10 小时前
Linux/Android 跟踪技术:ftrace、TRACE_EVENT、atrace、systrace 与 perfetto 入门
android·linux·运维
比昨天多敲两行11 小时前
Linux基础开发工具(下)
linux·运维·服务器
笨笨饿12 小时前
69_如何给自己手搓一个串口
linux·c语言·网络·单片机·嵌入式硬件·算法·个人开发