docker-compose一键部署Hadoop集群

1、hadoop简介

Hadoop 是一个由Apache软件基金会开发的开源、可靠的分布式计算框架。它的核心设计目标是能够以一种简单、可扩展的方式,处理从GB到PB级别的海量数据集,并能够在上千台普通的商用硬件上运行,提供高容错性。
2、Hadoop的优势

1.高可靠性:Hadoop底层维护多个数据副本,所以即使Hadoop某个计算元素或存储出现故障,也不会导致数据的丢失。

2.高扩展性:在集群间分配任务数据,可方便的扩展数以千计的节点。

3.高效性:在MapReduce的思想下,Hadoop是并行工作的,以加快任务处理速度。

4.高容错性:能够自动将失败的任务重新分配。

3、安装docker

1、安装依赖包

bash 复制代码
yum install -y yum-utils device-mapper-persistent-data lvm2

2、配置docker yum源

bash 复制代码
yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo

3、安装docker

bash 复制代码
yum install -y docker-ce

4、修改docker配置文件

bash 复制代码
mkdir /data/docker -p
sudo tee /etc/docker/daemon.json <<-'EOF'
{
   "data-root": "/data/docker"
}
EOF

5、启动docker

bash 复制代码
systemctl daemon-reload
systemctl enable docker --now
systemctl restart docker

6、安装docker-compose

#下载docker-compose文件

bash 复制代码
curl -L "https://github.com/docker/compose/releases/download/v2.29.0/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose
#给他一个执行权限
chmod +x /usr/local/bin/docker-compose
ln -s /usr/local/bin/docker-compose /usr/bin/docker-compose

#查看是否安装成功
docker-compose --version

4、hadoop安装(非高可用)

4.1、hadoop安装

bash 复制代码
yum -y install git
git clone https://gitee.com/hadoop-bigdata/docker-compose-hadoop.git
cd docker-compose-hadoop/hadoop
docker-compose -f docker-compose.yaml up -d

查看部署状态

bash 复制代码
docker-compose -f docker-compose.yaml ps

4.2、访问hadoop

bash 复制代码
HDFS:http://172.16.17.115:30070
bash 复制代码
YARN:http://172.16.17.115:30888

5、Hadoop HA部署(高可用)

5.1、hadoop集群安装

bash 复制代码
git clone https://gitee.com/hadoop-bigdata/docker-compose-hadoop.git
cd docker-compose-hadoop/hadoop-ha
docker-compose -f docker-compose.yaml up -d

查看部署状态

bash 复制代码
docker-compose -f docker-compose.yaml ps

5.2、访问hadoop

HDFS地址:

http://172.16.17.115:30070

http://172.16.17.115:30071

YARN:http://172.16.17.115:30888

6、简介

Hadoop是开启大数据时代的关键技术,它通过HDFS、MapReduce和YARN三大核心,奠定了分布式处理海量数据的基础架构。

相关推荐
WAIT_TIME4 小时前
昇腾910B虚拟卡(vNPU)创建以及Docker挂载
docker·容器·昇腾·runtime·虚拟显卡·vnpu
大大杰哥4 小时前
Docker笔记
java·docker
wuyikeer5 小时前
如何在docker中的mysql容器内执行命令与执行SQL文件
sql·mysql·docker
tian_jiangnan5 小时前
把 Docker 镜像推送到 阿里云容器镜像服务 ACR
阿里云·docker·容器
hINs IONN6 小时前
深入解析HDFS:定义、架构、原理、应用场景及常用命令
hadoop·hdfs·架构
隐于花海,等待花开6 小时前
Hive 常用函数详细总结
数据仓库·hive·hadoop
heimeiyingwang7 小时前
【架构实战】Docker容器网络模型详解
网络·docker·架构
Eric.Lee202118 小时前
docker 启动停止命令
运维·docker·容器
苏渡苇20 小时前
5 分钟跑起 Redis(Docker 版)
数据库·redis·缓存·docker·redis入门
深念Y1 天前
赛米尼M02/海纳斯HiNAS系统-WiFi驱动安装教程
运维·服务器·网络·docker·nas·机顶盒·hinas