hadoop集群准备工作

配置工作

关闭防火墙

bash 复制代码
systemctl stop firewalld
systemctl disable firewalld.service #禁止开机自启动

IP设置

cpp 复制代码
vim /etc/sysconfig/network-scripts/ifcfg-ens33
将动态ip获取BOOTPROTO="dhcp"改为静态static
添加IP地址IPADDR=192.168.10.100
网关GATEWAY=192.168.10.2
域名解析器DNS1=192.168.10.2

设置主机名并hosts映射

bash 复制代码
vim /etc/hostname
bash 复制代码
vim /etc/hosts
添加
192.168.10.100 hadoop1
192.168.10.101 hadoop2
192.168.10.102 hadoop3

创建用户并授权

bash 复制代码
useradd yunwei
passwd 773828xh
bash 复制代码
vim /etc/sudoers
在%wheel下面一行添加
yunwei ALL=(ALL) NOPASSWD:ALL

安装hadoop

bash 复制代码
tar -zxvf hadoop-3.2.0.tar.gz -C /opt/module/

配置环境变量

bash 复制代码
进入hadoop安装目录
cd hadoop-3.2.0
pwd 获取绝对路径
/opt/module/hadoop-3.2.0
vim /etc/profile.d/my_env.sh
增加
#HADOOP_HOME
export HADOOP_HOME =/opt/module/hadoop-3.2.0
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin
#别忘了source生效

SSH配置免密登录

bash 复制代码
#集群所有机器上生成公钥和私钥
ssh-keygen -t rsa
#公钥拷贝给集群所有机器
ssh-copy-id hadoop1
ssh-copy-id hadoop2
ssh-copy-id hadoop3
就可以ssh xxx免密登录了

时钟同步

三台机器都做

bash 复制代码
crontab -e
* * * * * /usr/sbin/ntpdate -u ntp.aliyun.com > /var/null 2>&1

编写集群分发脚本

bash 复制代码
cd /home/myxsync
mkdir bin
vim xsync
#!/bin/bash
#1. 判断参数个数
if [ $# -lt 1 ]
then
 echo Not Enough Arguement!
 exit;
fi

#2. 遍历集群所有机器
for host in hadoop1 hadoop2 hadoop3
do
 echo ==================== $host ====================
 #3. 遍历所有目录,挨个发送
 for file in $@
  do
 	#4. 判断文件是否存在
 	if [ -e $file ]
 	  then
 		#5. 获取父目录
 		pdir=$(cd -P $(dirname $file); pwd)
 		#6. 获取当前文件的名称
 		fname=$(basename $file)
 		ssh $host "mkdir -p $pdir"
 		rsync -av $pdir/$fname $host:$pdir
 	  else
 		echo $file does not exists!
 	fi
  done
 done

将脚本所在目录添加到环境变量
相关推荐
Francek Chen2 小时前
【大数据存储与管理】分布式数据库HBase:04 HBase的实现原理
大数据·数据库·hadoop·分布式·hbase
金融Tech趋势派2 小时前
企业微信私域流量:如何用企业微信SCRM从0到1搭建高转化客户运营体系
大数据·人工智能·企业微信·scrm
熊猫钓鱼>_>2 小时前
Puppeteer深度解析:Chrome自动化的艺术与实践
前端·人工智能·chrome·自动化·云计算·puppeteer·mcp
TDengine (老段)2 小时前
TDengine IDMP 组态面板 —— 图元
大数据·数据库·人工智能·物联网·时序数据库·tdengine
JosieBook3 小时前
【数据库】时序数据库选型指南:从大数据视角看 Apache IoTDB 的跨“端 - 边-云”架构优势
大数据·数据库·时序数据库
电商API&Tina3 小时前
1688跨境寻源通API数据采集: 获得1688商品详情关键字搜索商品按图搜索1688商品
大数据·前端·数据库·人工智能·爬虫·json·图搜索算法
岁岁种桃花儿3 小时前
Flink从入门到上天系列第十七篇:Flink当中的算子状态
大数据·flink
武子康3 小时前
大数据-249 离线数仓 - 电商分析 Hive 数仓实战:订单拉链表到 DWS 宽表设计与加载脚本详解
大数据·后端·apache hive
Lalolander3 小时前
生产计划频繁被打乱?利用MES构建动态排程与订单影响分析体系
大数据·人工智能·mes·制造执行系统·工单管理软件·工厂管理软件·生产计划管理