Hive集群的安装准备

Hive的安装与集群部署详细指南

一、环境与软件准备

在开始Hive的安装与集群部署之前,确保您准备好以下环境和软件:

  1. 虚拟机软件
    • VMware Workstation 17.5:用于创建和管理虚拟机,确保可以在其上安装Linux操作系统。
  2. 操作系统
    • CentOS 7 / RedHat:建议使用rpm/yum进行包管理,以简化软件的安装过程。
  3. 网络配置
    • IP段规划:设定IP地址范围为192.168.200.128至192.168.200.254。
    • 网关:设置为192.168.200.2。
    • 节点配置
      • 主节点:<font style="color:rgb(51, 51, 51);background-color:rgb(248, 248, 248);">bigdata01</font> (192.168.200.151)
      • 从节点:<font style="color:rgb(51, 51, 51);background-color:rgb(248, 248, 248);">bigdata02</font> (192.168.200.152) 和 <font style="color:rgb(51, 51, 51);background-color:rgb(248, 248, 248);">bigdata03</font> (192.168.200.153)
二、基础配置

在安装Hive之前,需要进行一些基础配置,以确保集群环境正常运行。

  1. 设置主机名
plain 复制代码
echo "bigdata01" > /etc/hostname
# 之后在bigdata02和bigdata03上设置对应的主机名
  1. 配置静态IP
    修改网络配置文件<font style="color:rgb(51, 51, 51);background-color:rgb(248, 248, 248);">/etc/sysconfig/network-scripts/ifcfg-ens33</font>,示例配置如下:
plain 复制代码
BOOTPROTO=static
ONBOOT=yes
IPADDR=192.168.200.151  # 对应主节点的IP
NETMASK=255.255.255.0
GATEWAY=192.168.200.2
DNS1=114.114.114.114
  1. 配置hosts文件
    为了使节点之间能够相互识别,修改<font style="color:rgb(51, 51, 51);background-color:rgb(248, 248, 248);">/etc/hosts</font>文件,添加以下内容:
plain 复制代码
echo -e "192.168.200.151 bigdata01\n192.168.200.152 bigdata02\n192.168.200.153 bigdata03" >> /etc/hosts
  1. 关闭防火墙
    在集群搭建初期,关闭防火墙以避免网络问题:
plain 复制代码
systemctl stop firewalld
systemctl disable firewalld
  1. 重启系统
    使配置生效:
plain 复制代码
reboot
三、JDK安装

Hive依赖于Java环境,因此必须先安装JDK。

  1. 卸载已有的JDK
    在安装新版本之前,首先卸载系统自带的JDK:
plain 复制代码
yum -y remove java-1.*
  1. 安装JDK
    下载并解压JDK:
plain 复制代码
mkdir /usr/java
tar -zxvf jdk-8u161-linux-x64.tar.gz -C /usr/java
  1. 配置环境变量
    <font style="color:rgb(51, 51, 51);background-color:rgb(248, 248, 248);">/etc/profile</font>中添加以下内容,使JDK环境变量生效:
plain 复制代码
export JAVA_HOME=/usr/java/jdk1.8.0_161
export PATH=$PATH:$JAVA_HOME/bin

运行以下命令使更改立即生效:

plain 复制代码
source /etc/profile
以上的 jdk 包与 系统镜像文件可以私信作者
相关推荐
奇点爆破XC16 小时前
Hadoop大数据生态(Ambari管理)组件服务详解
大数据·hadoop·ambari
段一凡-华北理工大学20 小时前
工业领域的Hadoop架构学习~系列文章22:Hadoop生态展望 - 面向未来的技术演进
大数据·人工智能·hadoop·分布式·学习·架构·高炉炼铁
Nefu_lyh20 小时前
【Hive】六、Hive 运算逻辑:数学 / 逻辑 / 条件 / 日期 / 字符串函数
数据仓库·hive·hadoop
知识分享小能手20 小时前
Hadoop学习教程,从入门到精通, HDFS分布式文件系统 — 完整知识点与案例代码(3)
hadoop·学习·hdfs
段一凡-华北理工大学2 天前
工业领域的Hadoop架构学习~系列文章20:故障诊断与根因分析 - 从表象到本质的智能推理
大数据·人工智能·hadoop·学习·架构·高炉炼铁·工业智能体
Francek Chen2 天前
【大数据处理与分析】MapReduce:05 MapReduce的具体应用
大数据·hadoop·分布式·mapreduce
知识分享小能手2 天前
Hadoop学习教程,从入门到精通, 部署Hadoop 3.x — 知识点详解(2)
大数据·hadoop·学习
AQin10122 天前
【对比向】既生瑜何生亮?不!Hive 和 Doris不一样
数据仓库·hive·hadoop·doris
段一凡-华北理工大学2 天前
工业领域的Hadoop架构学习~系列文章19:能源行业Hadoop应用实践
大数据·人工智能·hadoop·分布式·学习·架构·高炉炼铁
AQin10122 天前
【对比向】细算“成本”——Hive vs. Doris
大数据·数据库·hive·doris·实时数仓