大数据环境搭建

目录

一:虚拟机:VirtualBox

二:Shell工具:MobaXterm

三:安装脚本

四:JDK和Hadoop

4.1:安装

4.2:启动

4.3:Hadoop可视化访问

4.4:关机


一:虚拟机:VirtualBox

VirtualBox-6.0.24-139119-Win

1.1:默认配置

1.2:导入3个node

1.3:启动三个node

(有的电脑可能启动失败可以看看:VirtualBox 不能为虚拟电脑打开一个新任务(Failed to get device handle and/or partition ID for 0000000001c5fb30 )-CSDN博客

二:Shell工具:MobaXterm

下载地址:
MobaXterm Xserver with SSH, telnet, RDP, VNC and X11 - Home Edition

shell工具连接三个虚拟机

三台机器地址分别是192.168.56.151、192.168.56.152​​​、192.168.56.153

账号root 密码123456

三:安装脚本

复制代码
git clone https://gitee.com/several-boats/playground.git
cd playground/
chmod +x playground.sh
./playground.sh install
source /etc/profile
cd ~

四:JDK和Hadoop

4.1:安装

复制代码
先把两个安装包(hadoop-3.3.6.tar.gz\jdk-8u191-linux-x64.tar.gz)用shell工具拖拽到/root下
复制代码
playground add jdk-8u191-linux-x64.tar.gz
playground add hadoop-3.3.6.tar.gz
playground init
复制代码
以上信息是否正确---y
是否安装JDK--yes
是否修改jdk信息--n
复制代码
source /etc/profile
java -version
playground config hadoop
复制代码
是否要更新-- y
安装包序列号---1(选Hadoop)
需要安装到哪些节点---node01,node02,node03
主节点---node01
复制代码
playground update config
playground install hadoop
source /etc/profile
复制代码
是否修改Hadoop安装信息--n
复制代码
source /etc/profile
hadoop namenode -format --force
cd ~

4.2:启动

复制代码
cd ~
start-all.sh

安装完后再对另两个机器进行source /etc/profile命令

4.3:Hadoop可视化访问

HDFS:

192.168.56.151:9870----Hadoop3

192.168.56.151:50070----Hadoop2

里面有一些值得看的信息Live Nodes表示存活的节点

Yarn:

192.168.56.151:8088

4.4:关机

复制代码
cd ~
stop-all.sh

点击virtualBox三个node,点击停止-正常关机

平常最好备份下

相关推荐
B站_计算机毕业设计之家1 天前
python股票交易数据管理系统 金融数据 分析可视化 Django框架 爬虫技术 大数据技术 Hadoop spark(源码)✅
大数据·hadoop·python·金融·spark·股票·推荐算法
随心............1 天前
sqoop采集完成后导致hdfs数据与Oracle数据量不符的问题。怎么解决?
hive·hadoop·sqoop
Aurora_eye2 天前
记录之Ubuntu22.4虚拟机及hadoop为分布式安装
大数据·hadoop·分布式
随心............3 天前
在开发过程中遇到问题如何解决,以及两个经典问题
hive·hadoop·spark
yumgpkpm3 天前
CMP (类ClouderaCDP7.3(404次编译) )华为鲲鹏Aarch64(ARM)信创环境 查询2100w行 hive 查询策略
数据库·数据仓库·hive·hadoop·flink·mapreduce·big data
K_i1344 天前
Hadoop 集群自动化运维实战
运维·hadoop·自动化
Q26433650234 天前
【有源码】基于Python与Spark的火锅店数据可视化分析系统-基于机器学习的火锅店综合竞争力评估与可视化分析-基于用户画像聚类的火锅店市场细分与可视化研究
大数据·hadoop·python·机器学习·数据分析·spark·毕业设计
顧棟5 天前
【Yarn实战】Yarn 2.9.1滚动升级到3.4.1调研与实践验证
hadoop·yarn
D明明就是我5 天前
Hive 拉链表
数据仓库·hive·hadoop
嘉禾望岗5035 天前
hive join优化和数据倾斜处理
数据仓库·hive·hadoop