Linux安装并配置Hadoop

目录

  • 一、安装并配置JDK
  • 二、安装并配置Hadoop
  • 三、安装过程中遇到的问题总结

一、安装并配置JDK

Linux上一般会安装Open JDK,关于OpenJDK和JDK的区别:http://www.cnblogs.com/sxdcgaq8080/p/7487369.html

准备Open JDK 1.8

查询可安装的java版本

bash 复制代码
yum -y list java*

安装jdk1.8,由于我是M1 ARM系统,因此

bash 复制代码
yum install -y java-1.8.0-openjdk.aarch64

java -version查看已安装的jdk版本

java的安装目录为:/usr/lib/jvm

在/etc/profile下配置环境变量(这里已经配置了完整的环境变量,包括Hadoop)

bash 复制代码
# set java environment
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.312.b07-1.el8_4.aarch64
export JRE_HOME=$JAVA_HOME/jre
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export HADOOP_HOME=/opt/hadoop-1.2.1
export PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

二、安装并配置Hadoop

使用wget下载Hadoop压缩包

bash 复制代码
wget https://archive.apache.org/dist/hadoop/common/hadoop-1.2.1/hadoop-1.2.1.tar.gz

将hadoop压缩包移动至/opt目录下,并且解压

bash 复制代码
mv hadoop-1.2.1.tar.gz /opt/
cd /opt
tar -zxvf hadoop-1.2.1.tar.gz

可以在hadoop目录中配置conf目录下的文件

hadoop-env.sh

修改JAVA_HOME环境变量

bash 复制代码
# The java implementation to use.  Required.
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.312.b07-1.el8_4.aarch64

core-site.xml

xml 复制代码
<configuration>
    <!-- hadoop工作目录-->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/hadoop/tmp</value>
    </property>
    <!-- 元数据目录-->
    <property>
        <name>dfs.name.dir</name>
        <value>/hadoop/name</value>
    </property>
    <!--文件系统访问路径-->
    <property>
        <name>fs.default.name</name>
        <value>hdfs://imooc:900</value>
    </property>
</configuration>

hdfs-site.xml

xml 复制代码
<configuration>
    <!-- 文件系统数据存放目录-->
    <property>
        <name>dfs.data.dir</name>
        <value>/hadoop/data</value>
    </property>
</configuration>

mapred-site.xml

xml 复制代码
<configuration>
    <!-- 任务调度器访问路径-->
    <property>
        <name>mapred.job.tracker</name>
        <value>imooc:9001</value>
    </property>
</configuration>

在/etc/profile下,配置Hadoop环境变量

shell 复制代码
export HADOOP_HOME=/opt/hadoop-1.2.1

并且修改export PATH

shell 复制代码
export PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

在hadoop的bin目录下,对Hadoop的namenode进行格式化操作

shell 复制代码
hadoop namenode -format

并在bin目录启动hadoop,使用jps命令查看hadoop是否正常运行

使用其命令,查看hadoop下的文件

bash 复制代码
hadoop fs -ls /

可以看到有一个 Hadoop文件

三、安装过程中遇到的问题总结

1、ssh免密

运行staet-all.sh出现The authenticity of host 'localhost (::1)' can't be established,需要设置ssh免密

bash 复制代码
ssh -o StrictHostKeyChecking=no 192.168.2.100(本机IP)

2、hostname错误

运行staet-all.sh出现Exception in thread "main" java.net.UnknownHostException: unknown host: xxx
注意:hdfs://net:9000中的net是linux的主机名,可以通过echo $HOSTNAME查询主机

3、jps缺少

输入jps命令后,只有jps,那就说明配置有误,按照上文配置进行检查

4、warn信息

在输入一些hadoop命令时,可以看到如下的警告信息,但是不影响运行
Warning: $HADOOP_HOME is deprecated.

需在/etc/profile中添加

shell 复制代码
 export HADOOP_HOME_WARN_SUPPRESS=0
相关推荐
bjzhang7516 分钟前
CentOS下安装MySQL详解
linux·mysql·centos
Jason_chen2 小时前
Linux 6.2 音频机制深度解析:AI驱动的低延迟音频与零信任音频安全架构
linux
下午写HelloWorld2 小时前
Linux系统及Ubuntu常用指令
linux·ubuntu·操作系统
云计算磊哥@3 小时前
运维开发宝典026-MySQL02数据库表操作
运维·数据库·运维开发
weixin_523185323 小时前
Collections.unmodifiableMap详解:真的不可修改吗?
java·linux·前端
天天进步20154 小时前
Tunnelto 源码解析 #9:控制服务器设计:Warp、WebSocket、Ping/Pong 与连接保活
运维·服务器·websocket
凡人叶枫4 小时前
Effective C++ 条款04:确定对象被使用前已先被初始化
java·linux·开发语言·c++·嵌入式开发
云栖梦泽4 小时前
玩转RK3506SDK
linux·嵌入式硬件
极客先躯4 小时前
高级java每日一道面试题-2026年02月01日-实战篇[Docker]-Docker Volume 的生命周期管理是怎样的?
java·运维·docker·容器·持久化·架构图·容器卷
Java面试题总结5 小时前
Linux-Ubantu-贴士-apt的地盘
linux·运维·服务器