使用云虚拟机搭建hadoop集群环境

落霞的思绪2025-07-12 9:33

使用云虚拟机搭建hadoop集群环境

安装jdk17

配置docker网络

bash 复制代码

docker network create --subnet=172.18.0.0/16 hadoop

172.18.0.0：这是子网的网络地址，也就是这个网络的起始地址。
/16：这是子网掩码（Network Mask），表示前 16 位是网络部分，后 16 位是主机部分。

结合起来，172.18.0.0/16 表示：

网络范围从 172.18.0.0 到 172.18.255.255
可以在这个范围内为容器分配 IP 地址

查看

bath 复制代码

 docker network ls

网桥bridge的作用

隔离与连接： 一个 bridge 网络可以让容器在其内部相互通信，同时与宿主机分隔。
bridge 是一种虚拟的网络驱动，允许多个容器共享同一个虚拟网络，就像连接到一个虚拟的交换机（交换机常用的网络桥）一样。

拉取hadoop镜像

bath 复制代码

sudo docker pull kiwenlau/hadoop:1.0

拉取hadoop-cluster-docker

复制代码

git clone https://github.com/kiwenlau/hadoop-cluster-docker

之后：cd hadoop-cluster-docker

启动三节点容器：

bath 复制代码

./start-container.sh  # 默认启动1个master + 2个slave

复制代码

docker start hadoop-master hadoop-slave1 hadoop-slave2  # 同时启动三个容器

然后进入到hadoop-master节点里

复制代码

docker exec -it hadoop-master /bin/bash

之后执行

复制代码

./start-hadoop.sh  # 初始化并启动HDFS/YARN服务

然后执行

bath 复制代码

./run-wordcount.sh  # 运行WordCount测试任务

最后运行成功显示：

验证：进入Web管理界面

HDFS（NameNode） ：http://<云服务器公网IP>:50070
YARN（ResourceManager） ：http://<云服务器公网IP>:8088479

上一篇：飞算JavaAI：革新Java开发的智能助手

下一篇：高版本的MacOS如何降级？

热门推荐

01GitHub 镜像站点 022026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 03AI科技热点日报 | 2026年07月01日 04幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 05AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）072026年AI技术突破与产业落地全景：从GPT-5到多模态智能体的新纪元 082026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？09几个好用的ip纯净度检测网站 10Codex 下载安装指南：Windows 和 macOS 官方版下载