大数据技术——Hadoop运行环境搭建

目录

[一、 Hadoop运行环境搭建](#一、 Hadoop运行环境搭建)

[1.1 模板虚拟机环境准备](#1.1 模板虚拟机环境准备)

[1.2 克隆虚拟机](#1.2 克隆虚拟机)


一、 Hadoop运行环境搭建

1.1 模板虚拟机环境准备

0 )安装模板虚拟机,IP 地址 192.168.10.100**、主机名称** hadoop100**、内存4** G**、** 硬盘50G

具体操作参照下列文档

大数据技术之模板虚拟机环境准备-CSDN博客

1 )hadoop100 虚拟机配置要求如下(本文Linux 系统全部以CentOS-7.5-x86-1804 为例)

(1)使用yum安装需要虚拟机可以正常上网,yum安装前可以先测试下虚拟机联网情况

root@hadoop100 \~# ping www.baidu.com

PING www.baidu.com (14.215.177.39) 56(84) bytes of data.

64 bytes from 14.215.177.39 (14.215.177.39): icmp_seq=1 ttl=128 time=8.60 ms

64 bytes from 14.215.177.39 (14.215.177.39): icmp_seq=2 ttl=128 time=7.72 ms

(2)安装epel-release

注:Extra Packages for Enterprise Linux是为"红帽系"的操作系统提供额外的软件包,适用于RHEL、CentOS和Scientific Linux。相当于是一个软件仓库,大多数rpm包在官方 repository 中是找不到的)。

root@hadoop100 \~# yum install -y epel-release

(3)修改epel和yum源

使用linux上面的工具yum下载epel软件库中的软件的时候,默认访问的是国外的地址,所有最好修改为国内的仓库地址,下载速度会显著提升。

#进去对应目录

root@hadoop100 \~# cd /etc/yum.repos.d

#备份旧的配置文件

sudo mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup

#下载阿里源的文件

sudo wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo

清理缓存

root@hadoop100 \~# yum clean all

重新生成缓存

root@hadoop100 \~# yum makecache

更新yum源

root@hadoop100 \~# sudo yum update

(3)注意:如果Linux安装的是最小系统版,还需要安装如下工具;如果安装的是Linux桌面标准版,不需要执行如下操作

  • net-tool:工具包集合,包含ifconfig等命令

root@hadoop100 \~# yum install -y net-tools

  • vim:编辑器

root@hadoop100 \~# yum install -y vim

2 )关闭防火墙,关闭防火墙开机自启

root@hadoop100 \~# systemctl stop firewalld

root@hadoop100 \~# systemctl disable firewalld.service

注意:在企业开发时,通常单个服务器的防火墙时关闭的。公司整体对外会设置非常安全的防火墙。

3 )创建atguigu 用户,并修改atguigu 用户的密码

root@hadoop100 \~# useradd atguigu

root@hadoop100 \~# passwd 123456

4 )配置atguigu 用户具有root 权限,方便后期加sudo 执行root 权限的命令

root@hadoop100 \~# vim /etc/sudoers

修改/etc/sudoers文件,在%wheel这行下面添加一行,如下所示:

Allow root to run any commands anywhere

root ALL=(ALL) ALL

Allows people in group wheel to run all commands

%wheel ALL=(ALL) ALL

atguigu ALL=(ALL) NOPASSWD:ALL

注意:atguigu这一行不要直接放到root行下面,因为所有用户都属于wheel组,你先配置了atguigu具有免密功能,但是程序执行到%wheel行时,该功能又被覆盖回需要密码。所以atguigu要放到%wheel这行下面。

5 )在/opt 目录下创建文件夹,并修改所属主和所属组

(1)在/opt目录下创建module、software文件夹

root@hadoop100 \~# mkdir /opt/module

root@hadoop100 \~# mkdir /opt/software

(2)修改module、software文件夹的所有者和所属组均为atguigu用户

root@hadoop100 \~# chown atguigu:atguigu /opt/module

root@hadoop100 \~# chown atguigu:atguigu /opt/software

(3)查看module、software文件夹的所有者和所属组

root@hadoop100 \~# cd /opt/

root@hadoop100 opt# ll

总用量 12

drwxr-xr-x. 2 atguigu atguigu 4096 5月 28 17:18 module

drwxr-xr-x. 2 root root 4096 9月 7 2017 rh

drwxr-xr-x. 2 atguigu atguigu 4096 5月 28 17:18 software

6 )卸载虚拟机自带的JDK

注意:如果你的虚拟机是最小化安装不需要执行这一步。

root@hadoop100 \~# rpm -qa | grep -i java | xargs -n1 rpm -e --nodeps

  • rpm -qa:查询所安装的所有rpm软件包
  • grep -i:忽略大小写
  • xargs -n1:表示每次只传递一个参数
  • rpm -e --nodeps:强制卸载软件

7 )重启虚拟机

root@hadoop100 \~# reboot

1.2 克隆虚拟机

1 )利用模板机hadoop100 ,克隆三台虚拟机:hadoop102 、hadoop103 、hadoop104

注意:克隆时,要先关闭hadoop100。

2 )修改克隆机IP ,以下以hadoop102 举例说明

(1)修改克隆虚拟机的静态IP

atguigu@hadoop100 \~# sudo vim /etc/sysconfig/network-scripts/ifcfg-ens33

改成

DEVICE=ens33

TYPE=Ethernet

ONBOOT=yes

BOOTPROTO=static

NAME="ens33"

IPADDR=192.168.10.102

PREFIX=24

GATEWAY=192.168.10.2

DNS1=192.168.10.2

(2)查看Linux虚拟机的虚拟网络编辑器,编辑->虚拟网络编辑器->VMnet8

(3)查看Windows系统适配器VMware Network Adapter VMnet8的IP地址

(4)保证Linux系统ifcfg-ens33文件中IP地址、虚拟网络编辑器地址和Windows系统VM8网络IP地址相同。

3 )修改克隆机主机名,以下以hadoop102 举例说明

(1)修改主机名称

atguigu@hadoop100 \~# sudo vim /etc/hostname

hadoop102

(2)配置Linux克隆机主机名称映射hosts文件,打开/etc/hosts

atguigu@hadoop100 \~# sudo vim /etc/hosts

添加如下内容

192.168.10.100 hadoop100

192.168.10.101 hadoop101

192.168.10.102 hadoop102

192.168.10.103 hadoop103

192.168.10.104 hadoop104

192.168.10.105 hadoop105

192.168.10.106 hadoop106

192.168.10.107 hadoop107

192.168.10.108 hadoop108

4 )重启克隆机hadoop102

atguigu@hadoop100 \~# sudo reboot

5 )修改windows 的主机映射文件(hosts 文件)

(1)如果操作系统是window7,可以直接修改

①进入C:\Windows\System32\drivers\etc路径

②打开hosts文件并添加如下内容,然后保存

192.168.10.100 hadoop100

192.168.10.101 hadoop101

192.168.10.102 hadoop102

192.168.10.103 hadoop103

192.168.10.104 hadoop104

192.168.10.105 hadoop105

192.168.10.106 hadoop106

192.168.10.107 hadoop107

192.168.10.108 hadoop108

(2)如果操作系统是window10,先拷贝出来,修改保存以后,再覆盖即可

①进入C:\Windows\System32\drivers\etc路径

②拷贝hosts文件到桌面

③打开桌面hosts文件并添加如下内容

192.168.10.100 hadoop100

192.168.10.101 hadoop101

192.168.10.102 hadoop102

192.168.10.103 hadoop103

192.168.10.104 hadoop104

192.168.10.105 hadoop105

192.168.10.106 hadoop106

192.168.10.107 hadoop107

192.168.10.108 hadoop108

④将桌面hosts文件覆盖C:\Windows\System32\drivers\etc路径hosts文件

相关推荐
serve the people10 小时前
Elasticsearch(5) i want to monitor the es health from a http api
大数据·http·elasticsearch
2601_9594779111 小时前
Vatee:外汇行情信息呈现与技术架构如何影响体验,给出一套细节
大数据·人工智能·安全·ux
Kepler187411 小时前
注射器与输液器厂分布在哪里?全国主要产区梳理
大数据·其他
萤丰信息11 小时前
存量焕新 + 绿色低碳,2026 智慧园区转型新路径
大数据·人工智能
极客老王说Agent11 小时前
即时配送每日账单人工对账全攻略:结算误差如何快速排查修正?
大数据·人工智能·ai·chatgpt
lizhihai_9911 小时前
股市学习心得-六月的股市怎么应对
大数据·人工智能·科技·学习·区块链
新新学长搞科研11 小时前
【广东省博促会主办】2026年第七届先进材料与智能制造国际学术会议(ICAMIM 2026)
大数据·前端·数据库·人工智能·物联网
大树8811 小时前
本周液冷三件事 #2|Vera Rubin 227kW 全液冷量产 · 34 省 PUE 政策汇编 · 光模块也要液冷了
大数据·服务器·人工智能
Amy1870211182311 小时前
东南亚智慧物流园区的“隐形守护者”:有源滤波柜如何驯服变频器5/7次谐波
分布式·能源
白日与明月12 小时前
Hive子查询中的ORDER BY陷阱:为什么排序“消失”了?
数据仓库·hive·hadoop