Hive集群的安装准备

Hive的安装与集群部署详细指南

一、环境与软件准备

在开始Hive的安装与集群部署之前,确保您准备好以下环境和软件:

  1. 虚拟机软件
    • VMware Workstation 17.5:用于创建和管理虚拟机,确保可以在其上安装Linux操作系统。
  2. 操作系统
    • CentOS 7 / RedHat:建议使用rpm/yum进行包管理,以简化软件的安装过程。
  3. 网络配置
    • IP段规划:设定IP地址范围为192.168.200.128至192.168.200.254。
    • 网关:设置为192.168.200.2。
    • 节点配置
      • 主节点:<font style="color:rgb(51, 51, 51);background-color:rgb(248, 248, 248);">bigdata01</font> (192.168.200.151)
      • 从节点:<font style="color:rgb(51, 51, 51);background-color:rgb(248, 248, 248);">bigdata02</font> (192.168.200.152) 和 <font style="color:rgb(51, 51, 51);background-color:rgb(248, 248, 248);">bigdata03</font> (192.168.200.153)
二、基础配置

在安装Hive之前,需要进行一些基础配置,以确保集群环境正常运行。

  1. 设置主机名
plain 复制代码
echo "bigdata01" > /etc/hostname
# 之后在bigdata02和bigdata03上设置对应的主机名
  1. 配置静态IP
    修改网络配置文件<font style="color:rgb(51, 51, 51);background-color:rgb(248, 248, 248);">/etc/sysconfig/network-scripts/ifcfg-ens33</font>,示例配置如下:
plain 复制代码
BOOTPROTO=static
ONBOOT=yes
IPADDR=192.168.200.151  # 对应主节点的IP
NETMASK=255.255.255.0
GATEWAY=192.168.200.2
DNS1=114.114.114.114
  1. 配置hosts文件
    为了使节点之间能够相互识别,修改<font style="color:rgb(51, 51, 51);background-color:rgb(248, 248, 248);">/etc/hosts</font>文件,添加以下内容:
plain 复制代码
echo -e "192.168.200.151 bigdata01\n192.168.200.152 bigdata02\n192.168.200.153 bigdata03" >> /etc/hosts
  1. 关闭防火墙
    在集群搭建初期,关闭防火墙以避免网络问题:
plain 复制代码
systemctl stop firewalld
systemctl disable firewalld
  1. 重启系统
    使配置生效:
plain 复制代码
reboot
三、JDK安装

Hive依赖于Java环境,因此必须先安装JDK。

  1. 卸载已有的JDK
    在安装新版本之前,首先卸载系统自带的JDK:
plain 复制代码
yum -y remove java-1.*
  1. 安装JDK
    下载并解压JDK:
plain 复制代码
mkdir /usr/java
tar -zxvf jdk-8u161-linux-x64.tar.gz -C /usr/java
  1. 配置环境变量
    <font style="color:rgb(51, 51, 51);background-color:rgb(248, 248, 248);">/etc/profile</font>中添加以下内容,使JDK环境变量生效:
plain 复制代码
export JAVA_HOME=/usr/java/jdk1.8.0_161
export PATH=$PATH:$JAVA_HOME/bin

运行以下命令使更改立即生效:

plain 复制代码
source /etc/profile
以上的 jdk 包与 系统镜像文件可以私信作者
相关推荐
yumgpkpm6 小时前
CMP(类Cloudera CDP 7.3 404版华为泰山Kunpeng)和Apache Doris的对比
大数据·hive·hadoop·spark·apache·hbase·cloudera
电子硬件笔记1 天前
嵌入式硬件:如何理解高频电子线路,从入门开始
嵌入式硬件·硬件架构·硬件工程·嵌入式实时数据库
WPG大大通1 天前
AIoT | 软件:Astra MCP边缘算力构建详解
经验分享·笔记·python·硬件架构·代码
梦里不知身是客111 天前
spark读取table中的数据【hive】
大数据·hive·spark
yumgpkpm2 天前
Doris在CMP7(类Cloudera CDP 7 404版华为Kunpeng)启用 Kerberos部署Doris
大数据·hive·hadoop·python·oracle·flink·cloudera
数据牧羊人的成长笔记2 天前
Hadoop 分布式计算MapReduce和资源管理Yarn
hadoop·eclipse·mapreduce
新疆嘉博智选科技有限公司2 天前
Macos系统上搭建Hadoop详细过程
大数据·hadoop·分布式
计算机编程-吉哥2 天前
大数据毕业设计项目推荐 基于大数据的广西药店数据可视化分析系统 1.65w条数据【大数据毕业设计项目选题】
大数据·hadoop·毕业设计·计算机毕设·大数据毕业设计选题推荐
小湘西3 天前
在 Hive 中NULL的理解
数据仓库·hive·hadoop
牛奶咖啡133 天前
zabbix实现监控Hadoop、Docker、SSL证书过期时间应用的保姆级实操流程
hadoop·zabbix·docker-ce引擎安装·监控docker容器·监控ssl证书的过期时间·监控hadoop·安装配置agent2