大数据前置学习基础准备(非常详细!)

1.需要的环境

需要3台服务器，centos7

为集群，全部设置为nat模式

2.整个环境大体

1.设置三台Linux虚拟机的主机和固定ip

2.在Linux系统以及本机系统中配置了主机名映射

3.配置了三台服务器之间root用户的ssh免密互通

4.安装配置JDK环境

5.关闭防火墙和SELinux

6.更新时区和同步时间

7.拍摄快照

3.修改主机名，配置静态ip

vim /etc/hostanme

将里面的内容修改为root1，其他的机器以此类推root2，root3

设置固定ip地址，三台机器设置同一个网段，并且ip相连

vim /etc/sysconfig/network-scripts/ifcfg-ens33

修改后进行网卡重启

Systemctl restart network

4.配置Linux主机名映射

配置3台linux的/etc/hosts

配置这个原因就是之后再远程连接工具中只输入主机名就好了《例如

5.配置windows主机名映射

在windows系统中修改host文件，填入如下内容：

windows路径为C:\Windows\System32\drivers\etc下的hosts文件中添加ip和用户名

或者直接win+r输入system32

6.配置ssh免密登录

后续安装的集群化软件，多数需要远程登录以及远程执行命令，我们可以简单起见，配置三台Linux服务器之间的免密码互相ssh登录

1.首先在每一台机器中执行ssh-keygen -t rsa -b 4096 一直回车就好了（rsa是密钥，4096是4096位的密码）

2.再在每一台机器中执行ssh-copy-id root1，ssh-copy-id root2，ssh-copy-id root3

全部执行完毕后就root1,root2,root3用户之间就能免密互通，直接ssh root2就能切换到root2，其他也一样

创建hadoop用户并配置免密登录

后续大数据的软件，将不会以root用户启动(主要是确保安全，要是被黑客攻击了就不会是root权限，养成良好习惯)

1.在每台机器上执行useradd hadoop创建hadoop用户

2.在每一台机器上执行passwd hadoop，设置hadoop用户密码123456

3.每一台机器都切换到hadoop用户，su hadoop，并且执行ssh-keygen -t rsa -b 4096，创建ssh密钥

4.在每台机器上执行ssh-copy-id root1,ssh-copy-id root2,ssh-copy-id root3,现在也是一样能互通了

7.配置JDK环境

1.创建文件夹，用来部署JDK，将JDK和

Mkdir -p /export/server

上传jdk文件到服务器上，我用的是finalshell，直接拖进去

2.解压缩到这个export/server中

3.配置软链接

4.配置JAVA_HOME环境变量

加这两条

执行命令，让环境变量生效

将之前系统自带的java环境删除，将我们刚刚安装的创建一个软链接到系统目录下

执行命令验证，java -version，javac

另外的两台机器也是一样，使用远程复制过去java，之后配置环境变量

对三台虚拟机完成防火墙，SElinux，时间同步等系统设置

8.关闭防火墙和SELinux

集群化软件之间需要通过端口互相通讯，为了避免出现网络不通的问题，我们可以简单的在集群内部关闭防火墙

Linux有一个安全模块：SELinux，用以限制用户和程序的相关权限，来确保系统的安全稳定

在当前，我们需要关闭SELinux功能，避免导致后面的软件运行出现问题

编辑文件修改

重启才能生效

9.修改时间地区配置自动时间同步

1.安装ntp软件

yum install -y ntp

2.更新时区

rm -f /etc/localtime;sudo In -s /usr/share/zoneinfo/Asia/Shanghai /etc/localtime

3.同步时间

ntpdate -u ntp.aliyun.com

4.开启ntp服务并设置开机自启

systemctl start ntpd

systemctl enable ntpd

最后拍摄快照，防止之后出现问题