【Hadoop01-完全分布式运行模式】

1、分析

1)准备3台服务器(先配置一台,然后克隆两台)

2)安装JDK(之前配置过)

3)安装hadoop(hadoop下载点击此处

4)配置环境变量(vim /etc/profile)

5)配置集群

6)单点启动

7)配置ssh

8)群起并测试集群

2、编写集群分发脚本

因为我只在其中一个服务器上安装了hadoop,需要将安装好的hadoop分发到另外两个服务器,所以这里通过集群分发脚本将hadoop分发到另外两外机器。

2.1、scp( secure copy 安全 拷贝

定义:scp可以实现服务器与服务器之间的数据拷贝

基本语法:

scp -r pdir/fname user@host:pdir/fname

命令 递归 要拷贝的文件路径/名称 目的地用户@主机:目的地路径/名称

在160服务器操作,将文件从160 拷贝到 161

scp -r c/ root@192.168.121.161:/opt/software/

在161服务器操作,将文件从160拷贝到161

scp -r root@192.168.121.161:/opt/software/hadoop-3.1.3 /opt/software/

在161服务器操作,将160的文件拷贝到162

scp -r root@192.168.121.160:/opt/software/hadoop-3.1.3 root@192.168.121.162:/opt/software/

2.2、rsync远程 同步 工具

定义:

rsync主要用于备份和镜像。具有速度快、避免复制相同内容和支持符号链接的优点。

rsync和scp区别:用rsync做文件的复制要比scp的速度快,rsync只对差异文件做更新。scp是把所有文件都复制过去。

差异:scp全量拷贝,rsync增量拷贝

基本语法:

rsync -av pdir/fname user@host:pdir/fname

命令 选项参数 要拷贝的文件路径/名称 目的地用户@主机:目的地路径/名称

只同步差异化文件,将160同步到161

rsync -av root@192.168.121.160:/opt/software/hadoop-3.1.3/ /opt/software/hadoop-3.1.3/

简化脚本(好用的同步分发脚本)

预期目标:1、xsync + 文件名称 ,即可实现多个服务器完成同步操作。2、任何路径下都可以实现。

下载工具xsync:yum -y install xsync

编写脚本:

#!/bin/bash

#1. 判断参数个数

if $# -lt 1

then

echo Not Enough Arguement!

exit;

fi

#2. 遍历集群所有机器

for host in 服务器160 服务器161 服务器162

do

echo ==================== $host ====================

#3. 遍历所有目录,挨个发送

for file in $@

do

#4. 判断文件是否存在

if -e $file

then

#5. 获取父目录

pdir=(cd -P (dirname $file); pwd)

#6. 获取当前文件的名称

fname=(basename file)

ssh host "mkdir -p pdir"

rsync -av pdir/fname host:pdir

else

echo $file does not exists!

fi

Done

done

将脚本放到/bin目录下:mv xsync /bin

测试:在根目录下创建一个目录110,然后执行脚本,去其它服务器看是否已完成同步

建目录

mkdir 110

同步

rsync 110

同步环境变量

同步

rsync /etc/profile

生效

source /etc/profile

java

java -version

hadoop

hadoop version

相关推荐
隔壁阿布都1 小时前
ShedLock 分布式定时任务锁框架介绍
spring boot·分布式
文艺倾年2 小时前
【强化学习】数学推导专题,20W字总结(十五)
人工智能·分布式·大模型·强化学习·vibecoding
ACP广源盛1392462567319 小时前
GSV5600@ACP#多接口协议转换芯片,物理 AI 便携终端的互联核心
大数据·人工智能·分布式·嵌入式硬件·spark
极客先躯1 天前
高级java每日一道面试题-2026年02月12日-实战篇[Docker]-什么是容器的 Seccomp 配置?如何自定义?
java·运维·分布式·docker·容器·自动化·文件
Francek Chen1 天前
【大数据处理与分析】MapReduce:06 MapReduce编程实践
大数据·hadoop·分布式·mapreduce
小马爱打代码1 天前
Kafka消息队列监控:Topic积压、吞吐量、Broker负载及消费者组全观测
分布式·kafka
轻口味1 天前
轻规划鸿蒙开发实战10:分布式数据同步深度博弈,UserId 隔离与并发数据冲突消解机
分布式·华为·harmonyos·鸿蒙
Solis程序员1 天前
Raft:分布式系统的定海神针
java·分布式·kafka·rabbitmq·agent·raft
我是一颗柠檬1 天前
【Java项目技术亮点】Leaf号段模式双Buffer优化
java·开发语言·分布式·后端·架构