hadoop集群准备工作

配置工作

关闭防火墙

bash 复制代码
systemctl stop firewalld
systemctl disable firewalld.service #禁止开机自启动

IP设置

cpp 复制代码
vim /etc/sysconfig/network-scripts/ifcfg-ens33
将动态ip获取BOOTPROTO="dhcp"改为静态static
添加IP地址IPADDR=192.168.10.100
网关GATEWAY=192.168.10.2
域名解析器DNS1=192.168.10.2

设置主机名并hosts映射

bash 复制代码
vim /etc/hostname
bash 复制代码
vim /etc/hosts
添加
192.168.10.100 hadoop1
192.168.10.101 hadoop2
192.168.10.102 hadoop3

创建用户并授权

bash 复制代码
useradd yunwei
passwd 773828xh
bash 复制代码
vim /etc/sudoers
在%wheel下面一行添加
yunwei ALL=(ALL) NOPASSWD:ALL

安装hadoop

bash 复制代码
tar -zxvf hadoop-3.2.0.tar.gz -C /opt/module/

配置环境变量

bash 复制代码
进入hadoop安装目录
cd hadoop-3.2.0
pwd 获取绝对路径
/opt/module/hadoop-3.2.0
vim /etc/profile.d/my_env.sh
增加
#HADOOP_HOME
export HADOOP_HOME =/opt/module/hadoop-3.2.0
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin
#别忘了source生效

SSH配置免密登录

bash 复制代码
#集群所有机器上生成公钥和私钥
ssh-keygen -t rsa
#公钥拷贝给集群所有机器
ssh-copy-id hadoop1
ssh-copy-id hadoop2
ssh-copy-id hadoop3
就可以ssh xxx免密登录了

时钟同步

三台机器都做

bash 复制代码
crontab -e
* * * * * /usr/sbin/ntpdate -u ntp.aliyun.com > /var/null 2>&1

编写集群分发脚本

bash 复制代码
cd /home/myxsync
mkdir bin
vim xsync
#!/bin/bash
#1. 判断参数个数
if [ $# -lt 1 ]
then
 echo Not Enough Arguement!
 exit;
fi

#2. 遍历集群所有机器
for host in hadoop1 hadoop2 hadoop3
do
 echo ==================== $host ====================
 #3. 遍历所有目录,挨个发送
 for file in $@
  do
 	#4. 判断文件是否存在
 	if [ -e $file ]
 	  then
 		#5. 获取父目录
 		pdir=$(cd -P $(dirname $file); pwd)
 		#6. 获取当前文件的名称
 		fname=$(basename $file)
 		ssh $host "mkdir -p $pdir"
 		rsync -av $pdir/$fname $host:$pdir
 	  else
 		echo $file does not exists!
 	fi
  done
 done

将脚本所在目录添加到环境变量
相关推荐
Databend3 小时前
2KB histogram 背后:Databend 如何低成本追踪长尾延迟
大数据·数据分析·agent
Databend5 小时前
从湖仓升级为 Agent 时代的数据控制面,Snowflake 和 Databricks 有哪些布局
大数据·数据库·agent
阿里云大数据AI技术1 天前
StarRocks x Fluss x Paimon湖流一体方案:构建秒级响应、湖流一体的实时数据引擎
大数据·人工智能
Databend1 天前
Agent 轨迹分析与归因的数据工程实践
大数据·数据库·agent
喵个咪1 天前
Go Wind UBA 拆解系列 - 架构总览:三服务、数据流与契约优先
大数据·后端·go
喵个咪1 天前
Go Wind UBA 拆解系列 - 多租户与安全:两套隔离机制的边界
大数据·后端·go
喵个咪1 天前
Go Wind UBA 拆解系列 - OLAP 与 SQL 硬核:25 个分析模型怎么落地
大数据·后端·go
喵个咪1 天前
Go Wind UBA 拆解系列 - SDK 与采集层:从浏览器到 Kafka
大数据·后端·go
QCC产品中心1 天前
MiniMax Agent 接入实测:企业查询、股权穿透与 UBO 识别(附 Prompt 模板)
大数据·mcp·金融/非金融
SelectDB2 天前
Apache Doris Python UDF:让 SQL 直接调用 Python 生态,支撑 Agent 时代复杂业务逻辑
大数据·数据库·python