hadoop集群准备工作

配置工作

关闭防火墙

bash 复制代码
systemctl stop firewalld
systemctl disable firewalld.service #禁止开机自启动

IP设置

cpp 复制代码
vim /etc/sysconfig/network-scripts/ifcfg-ens33
将动态ip获取BOOTPROTO="dhcp"改为静态static
添加IP地址IPADDR=192.168.10.100
网关GATEWAY=192.168.10.2
域名解析器DNS1=192.168.10.2

设置主机名并hosts映射

bash 复制代码
vim /etc/hostname
bash 复制代码
vim /etc/hosts
添加
192.168.10.100 hadoop1
192.168.10.101 hadoop2
192.168.10.102 hadoop3

创建用户并授权

bash 复制代码
useradd yunwei
passwd 773828xh
bash 复制代码
vim /etc/sudoers
在%wheel下面一行添加
yunwei ALL=(ALL) NOPASSWD:ALL

安装hadoop

bash 复制代码
tar -zxvf hadoop-3.2.0.tar.gz -C /opt/module/

配置环境变量

bash 复制代码
进入hadoop安装目录
cd hadoop-3.2.0
pwd 获取绝对路径
/opt/module/hadoop-3.2.0
vim /etc/profile.d/my_env.sh
增加
#HADOOP_HOME
export HADOOP_HOME =/opt/module/hadoop-3.2.0
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin
#别忘了source生效

SSH配置免密登录

bash 复制代码
#集群所有机器上生成公钥和私钥
ssh-keygen -t rsa
#公钥拷贝给集群所有机器
ssh-copy-id hadoop1
ssh-copy-id hadoop2
ssh-copy-id hadoop3
就可以ssh xxx免密登录了

时钟同步

三台机器都做

bash 复制代码
crontab -e
* * * * * /usr/sbin/ntpdate -u ntp.aliyun.com > /var/null 2>&1

编写集群分发脚本

bash 复制代码
cd /home/myxsync
mkdir bin
vim xsync
#!/bin/bash
#1. 判断参数个数
if [ $# -lt 1 ]
then
 echo Not Enough Arguement!
 exit;
fi

#2. 遍历集群所有机器
for host in hadoop1 hadoop2 hadoop3
do
 echo ==================== $host ====================
 #3. 遍历所有目录,挨个发送
 for file in $@
  do
 	#4. 判断文件是否存在
 	if [ -e $file ]
 	  then
 		#5. 获取父目录
 		pdir=$(cd -P $(dirname $file); pwd)
 		#6. 获取当前文件的名称
 		fname=$(basename $file)
 		ssh $host "mkdir -p $pdir"
 		rsync -av $pdir/$fname $host:$pdir
 	  else
 		echo $file does not exists!
 	fi
  done
 done

将脚本所在目录添加到环境变量
相关推荐
鹧鸪云光伏14 小时前
微电网容量规划软件:光储设备配置一站式解决方案
大数据·储能·光伏·储能设计方案
扫地的小何尚14 小时前
NVIDIA Vera Rubin 平台如何解决 Agentic AI 的 Scale-up 难题
大数据·人工智能·机器学习
kekekka15 小时前
重塑品牌增长逻辑:专业媒体发稿服务如何让每一分预算产生长效复利?
大数据·搜索引擎·媒体
Gongxiangqishou16 小时前
县域即时配送订单规模同比增长35%,远超一线城市的22%
大数据·人工智能
落日屿星辰17 小时前
【无标题】
大数据
云登指纹浏览器17 小时前
指纹浏览器RPA自动化实战:跨境电商多账号运营效率提升指南
大数据·自动化·rpa
2601_9578793318 小时前
短视频矩阵的数据驱动运营:从流量监测到内容迭代的完整技术链路
大数据·矩阵·音视频
珠海西格电力18 小时前
零碳园区的碳排放指标计算的实操步骤
大数据·运维·人工智能·物联网·能源
WL_Aurora18 小时前
大数据技术之SparkSQL
大数据·sparksql
简信CRM18 小时前
小微型企业如何利用CRM对公司内外部管理进行优化转型?
大数据·crm·简信crm