hadoop学习系列--环境安装

先说踩的坑:刚开始学习,使用mac本安装单机hadoop,遭遇mac自身安全限制,到时dfs启动报错,解决后又出现新的问题,部分所需端口无法申请到,导致hadoop启动时报。

最终决定,使用虚拟机,在centos7下安装单机hadoop。

记录下踩得的:在解压hadoop包时所用的用户,和后续操作使用的用户最好使用一个,否则会报权限相关问题。

先要安装java环境,并配置环境变量:/etc/profile。配置完后一定要重新加载环境变量:source /etc/profile。

接下里将解压的hadoop所存放的根目录配置在环境变量中。

然后配置 hadoop/etc/hadoop/hdfs-site.xml、core-site.xml、yarn-site.xml和mapre-site.xml.个文件配置分别如下:

hdfs-site.xml

<property>

<name>fs.defaultFS</name>

<value>hdfs://127.0.0.1:9000</value> //如果其他主机也要访问,那就将127.0.0.1:9000改为:你的网卡IP:9000,或者改为0.0.0.0:9000

</property>

<property>

<name>hadoop.tmp.dir</name>

<!-- 自定义 hadoop 的工作目录 -->

<value>/usr/local/hadoop/hadoop-3.3.4/hadoopdata</value>

</property>

<property>

<name>hadoop.native.lib</name>

<!-- 禁用Hadoop的本地库 -->

<value>false</value>

</property>

hdfs-site.xml

复制代码
   <property>
       <name>dfs.replication</name>
       <value>1</value>
   </property>

yarn-site.xml

复制代码
<property>
               <name>yarn.resourcemanager.hostname</name>
               <value>127.0.0.1</value>
       </property>
       <property>
               <name>yarn.resourcemanager.webapp.address</name>
               <!-- yarn web 页面 -->
               <value>0.0.0.0:8088</value>
       </property>
       <property>
               <name>yarn.nodemanager.aux-services</name>
               <!-- reducer获取数据的方式 -->
               <value>mapreduce_shuffle</value>
       </property>

etc/hadoop/hadoop-env.sh

将当前用户 root 赋给下面这些变量

export HDFS_NAMENODE_USER=root

export HDFS_DATANODE_USER=root

export HDFS_SECONDARYNAMENODE_USER=root

export YARN_RESOURCEMANAGER_USER=root

export YARN_NODEMANAGER_USER=root

JAVA的绝对路径,可以使用whereis java查看

export JAVA_HOME=/usr/local/java/jdk1.8.0_341

Hadoop的安装路径下的etc/hadoop的绝对路径

export HADOOP_CONF_DIR=/usr/local/hadoop/hadoop-3.3.4/etc/hadoop

详细操作参考:Centos7.X安装单机Hadoop(3.3.4版本) - 粉色纽扣 - 博客园 (cnblogs.com)

相关推荐
爱睡懒觉的焦糖玛奇朵23 分钟前
【人工智能学习之人脸识别】
人工智能·学习
小丑西瓜66625 分钟前
c++智能指针
开发语言·c++·学习·基础语法·智能指针
程序猿老樊1 小时前
Artcam中文版安装包+教程网盘资源下载
学习
一 乐1 小时前
学习平台|基于java的移动学习平台系统小程序(源码+数据库+文档)
java·数据库·学习·小程序·论文·apache
limengshi1383922 小时前
通信工程学习:什么是PC永久连接、SPC软永久连接
网络·网络协议·学习·信息与通信
Filotimo_2 小时前
使用 Anaconda 环境在Jupyter和PyCharm 中进行开发
ide·经验分享·笔记·python·学习·jupyter·pycharm
mljy.2 小时前
C/C++内存管理
c++·学习
宁子希3 小时前
一,掌心里的智慧:我的 TinyML 学习之旅
人工智能·学习
朝九晚五ฺ3 小时前
【oj刷题】滑动窗口篇:滑动窗口的应用场景和注意事项
数据结构·c++·学习·算法
lwprain4 小时前
龙蜥8.9系统hadoop3.3.6上spark3.5.2安装(伪分布)
hadoop·spark