Hadoop学习(一) 搭建伪分布式集群

文章结构

1.准备工作

  1.1 配置IP

  1.2 关闭防火墙

  1.3 修改主机名并与IP绑定

  1.4 创建新用户

  1.5 配置免密匙

2.安装并配置Hadoop伪分布式集群  

  2.1 安装Java

  2.2 安装配置Hadoop伪分布式集群

1.准备工作

  1.1 配置IP

    首先进入该路径下 cd /etc/sysconfig/network-scripts,找到 ifcfg-eth0 这个文件

      编辑 ifcfg-eth0 ,配置IP地址,跟自己主机地址相对应 

    关闭虚拟机,将网络适配器改为桥接模式

  1.2 关闭防火墙

  

  1.3 修改主机名并于IP绑定

  1.4 创建新用户

  1.5 配置免密匙

  首先执行 ssh-keygen -t rsa 然后一直回车

然后进入生成的文件下 cp id_rsa.pub authorized_keys

验证一下 ssh hadooptest

2.安装并配置Hadoop伪分布式集群

  首先创建一个目录 software 用于存放我们上传的文件

  然后使用远程工具将我们需要的安装包上传到该目录下

  2.1 安装Java

  将压缩包解压 tar -zxvf jdk

  配置环境变量  vim ~/.bash_profile

  使环境变量生效  source ~/.bash_profile

  验证  java -version

  2.2 安装配置Hadoop伪分布式集群

  将 Hadoop 压缩包解压 tar -zxvf hadoop

 

 配置核心文件  hadoop-env.sh  core-site.xml  hdfs-site.xml  mapred-site.xml  yarn-site.xml  workers

  hadoop-env.sh 文件内容

  core-site.xml 文件内容

  首先在安装目录下创建一个新目录 hadooptmp

  文件内容

   hdfs-site.xml文件内容

  mapred-site.xml 文件内容

  yarn-sie.xml 文件内容

  workers 文件内容

  

  配置环境变量  vim ~/.bash_profile

  格式化Hadoop  hadoop namenode -format

  启动Hadoop   start-all.sh