Ubuntu下部署Hadoop集群+Hive(二)

Hadoop集群搭建

准备环境

hadoop-3.3.6.tar.gz,jdk-8u421-linux-x64.tar.gz

根据自己的使用下载对的hadoop和jdk版本

hadoop下载地址:Apache Hadoop

JDK下载地址:Java Downloads | Oracle

在3台服务器上的/opt/目录下新建module和software文件夹,其中software文件夹用来存放软件包,module用来存放解压后的安装文件;

bash 复制代码
root@hadoopMaster:/opt# mkdir software
root@hadoopMaster:/opt# mkdir module

接下来就是Hadoop集群环境的部署:

参考尚硅谷大数据---搭建Hadoop集群---软件安装_尚硅谷hadoop集群配置-CSDN博客

这篇文章对应的课程是23_尚硅谷_Hadoop_入门_克隆三台虚拟机_哔哩哔哩_bilibili,其中的23节到34节教程,讲的比较详细,建议先快速过一下相关章节课程,然后对照来安装,基本没有问题;

其中,有几点注意:

1.课程中的三台主机,Hadoop102、Hadoop103、Hadoop104,对应的我的主机是HadoopMaster、HadoopSlave01和HadoopSlave02;

2.课程后面新建的为了方便查看各个服务器进程启动情况的jpsall.sh脚本,运行的时候可能会报:bash: jps: command not found;这种情况,需要加上jps的全路径,这样改写就可以: ssh $host "/opt/module/jdk1.8.0_421/bin/jps"。

相关推荐
计算机毕业编程指导师11 小时前
【计算机毕设推荐】Python+Hadoop+Spark共享单车数据可视化分析系统 毕业设计 选题推荐 毕设选题 数据分析 机器学习 数据挖掘
大数据·hadoop·python·计算机·数据挖掘·spark·课程设计
计算机毕业编程指导师11 小时前
【计算机毕设】基于Hadoop的共享单车订单数据分析系统+Python+Django全栈开发 毕业设计 选题推荐 毕设选题 数据分析 机器学习 数据挖掘
大数据·hadoop·python·计算机·数据挖掘·spark·django
计算机毕业编程指导师16 小时前
【计算机毕设选题推荐】基于Hadoop+Spark的诺贝尔奖可视化分析系统源码 毕业设计 选题推荐 毕设选题 数据分析 机器学习 数据挖掘
大数据·hadoop·python·计算机·spark·毕业设计·诺贝尔奖
m0_7162550018 小时前
第二部分 电商离线数仓 全套项目代码(可直接在你伪分布式 Hive 运行)
hive·hadoop·分布式
kybs19912 天前
springboot租车系统--附源码68701
java·hadoop·spring boot·python·django·asp.net·php
计算机毕业编程指导师2 天前
【Python大数据项目推荐】基于Hadoop+Django脑卒中风险分析系统源码解析 毕业设计 选题推荐 毕设选题 数据分析 机器学习 数据挖掘
大数据·hadoop·python·计算机·spark·毕业设计·脑卒中
计算机毕业编程指导师2 天前
【大数据毕设推荐】Hadoop+Spark电影票房分析系统,Python+Django全栈实现 毕业设计 选题推荐 毕设选题 数据分析 机器学习 数据挖掘
大数据·hadoop·python·计算机·spark·毕业设计·电影票房
计算机毕业编程指导师3 天前
【计算机毕设推荐】Python+Spark卵巢癌风险数据可视化系统完整实现 毕业设计 选题推荐 毕设选题 数据分析 机器学习 数据挖掘
hadoop·python·计算机·数据挖掘·spark·毕业设计·卵巢癌
极光代码工作室3 天前
基于大数据的校园消费行为分析系统
大数据·hadoop·python·数据分析·spark
二十六画生的博客4 天前
每个subtask都提交一份快照到hdfs,会把10个小的快照合并成一个大的吗?谁来合并?
大数据·hadoop·hdfs·flink