hadoop-3.4.1 单机伪部署

下载并安装软件

上传安装软件到服务器

解压安装:tar -xzvf hadoop-3.4.1.tar.gz -C /opt/module/

Hadoop配置

  1. 配置hadoop环境变量:

    bash 复制代码
    sudo vim /etc/profile.d/myprofile.sh
    
    #HADOOP_HOME
    export HADOOP_HOME=/opt/module/hadoop-3.4.1
    export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
    export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
    export HADOOP_CLASSPATH=$(hadoop classpath)

    应用变更: source /etc/profile

  2. 配置hadoop使用的JAVA环境

    bash 复制代码
    sudo vim $HADOOP_HOME/etc/hadoop/hadoop-env.sh
    
    # 配置Hadoop使用的JAVA路径
    export JAVA_HOME=/opt/module/jdk-17.0.10
  3. 配置core-site.xml

    bash 复制代码
    vim $HADOOP_HOME/etc/hadoop/core-site.xml
    XML 复制代码
    <configuration>
      <property>
        <name>fs.defaultFS</name>
        <value>hdfs://mydoris:9000</value>
        <description>NameNode的地址</description>
      </property>
      <property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/data/hadoop/tmp</value>
        <description>hadoop数据存储目录</description>
      </property>
    </configuration>
  4. 配置hdfs-site.xml

    bash 复制代码
    vim  $HADOOP_HOME/etc/hadoop/hdfs-site.xml
    XML 复制代码
    <configuration>
      <property>
        <name>dfs.replication</name>
        <value>1</value>  <!-- 单机只需1副本 -->
      </property>
      <property>
        <name>dfs.namenode.name.dir</name>
        <value>file://${hadoop.tmp.dir}/dfs/name</value>
      </property>
      <property>
        <name>dfs.datanode.data.dir</name>
        <value>file://${hadoop.tmp.dir}/dfs/data</value>
      </property>
    </configuration>
  5. 配置 yarn-site.xml

    bash 复制代码
    vim $HADOOP_HOME/etc/hadoop/yarn-site.xml
    XML 复制代码
    <configuration>
      <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
      </property>
      <property>
        <name>yarn.nodemanager.env-whitelist</name>
        <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
      </property>
    </configuration>

配置mapred-site.xml

bash 复制代码
vim $HADOOP_HOME/etc/hadoop/mapred-site.xml
XML 复制代码
<configuration>
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>
</configuration>
  1. 解决Hadoop 3.4与JDK 17冲突问题

    bash 复制代码
    # 编辑 Hadoop 环境配置文件
    cd /opt/module/hadoop-3.4.1
    vim etc/hadoop/hadoop-env.sh
    
    # 文件末尾 添加以下内容:
    # Fix for JDK 17+ module access restrictions
    export HADOOP_OPTS="$HADOOP_OPTS --add-opens=java.base/java.lang=ALL-UNNAMED"
    export HADOOP_OPTS="$HADOOP_OPTS --add-opens=java.base/java.lang.reflect=ALL-UNNAMED"
    export HADOOP_OPTS="$HADOOP_OPTS --add-opens=java.base/java.net=ALL-UNNAMED"
    export HADOOP_OPTS="$HADOOP_OPTS --add-opens=java.base/java.util=ALL-UNNAMED"
    export HADOOP_OPTS="$HADOOP_OPTS --add-opens=java.base/sun.nio.ch=ALL-UNNAMED"
    export HADOOP_OPTS="$HADOOP_OPTS --add-opens=java.base/java.nio=ALL-UNNAMED"
    export HADOOP_OPTS="$HADOOP_OPTS --add-opens=java.base/java.util.concurrent=ALL-UNNAMED"
    
    # 若已经启动过hdfs,需要清理并重启hadoop
    # 停止
    ./sbin/stop-yarn.sh
    ./sbin/stop-dfs.sh
    
    # 删除临时数据(避免 clusterID 冲突)
    rm -rf /tmp/hadoop-*
    
    # 重新格式化(使用 JDK 17)
    hdfs namenode -format
    
    # 启动
    ./sbin/start-dfs.sh
    ./sbin/start-yarn.sh

启动Hadoop服务

格式化 NameNode(首次)

bash 复制代码
./bin/hdfs namenode -format

启动 HDFS + YARN

bash 复制代码
./sbin/start-dfs.sh
./sbin/start-yarn.sh

验证服务

bash 复制代码
jps


4.

查看启动日志

  1. 日志路径:/opt/module/hadoop-3.4.1/logs/

访问 WEB UI

  1. HDFS: http://mydoris:9870

  2. YARN: http://mydoris:8088
复制代码
### 测试 HDFS 读写
复制代码
```bash
./bin/hadoop fs -mkdir /t001
./bin/hadoop fs -put ~/.bashrc /t001/
./bin/hadoop fs -ls /t001
```

![](https://i-blog.csdnimg.cn/direct/48541ffb32e44cd48e49fdf8d537abda.png)![](https://i-blog.csdnimg.cn/direct/7846ac49d679456a8365a1789034efcd.png)
相关推荐
大树885 小时前
金刚石散热越强,管路越先见顶
大数据·运维·服务器·人工智能·ai
摇滚侠5 小时前
Linux CentOS7 rpm 安装 MySQL 5.7
linux·运维·mysql
大志哥1235 小时前
ES和Logstash日志链路系统上线后遭遇切片爆炸(解决)
大数据·elasticsearch
bush45 小时前
嵌入式linux学习记录十四、术语
linux·嵌入式
载数而行5205 小时前
Linux 11 动态监控指令top
linux
果丁智能6 小时前
物联网智能锁赋能集中式住宿:身份核验与远程权限管控的全链路技术实践
大数据·人工智能·物联网·智能家居
王小王-1237 小时前
基于 Hive 的网易云音乐数据分析及可视化系统
hive·hadoop·数据分析·音乐数据分析·网易云音乐分析·hive音乐分析·hadoop网易云
不会C语言的男孩7 小时前
Linux 系统编程 · 第 8 章:进程基础
linux·c语言
ApacheSeaTunnel7 小时前
实战演示 | 基于 Apache SeaTunnel 与 Apache DolphinScheduler 实现 MySQL 到 Doris 离线定时增量同步
大数据·mysql·开源·doris·数据集成·seatunnel·数据同步
古城小栈7 小时前
Unix 与 Linux 异同小叙
linux·服务器·unix