【分布式数据仓库Hive】Hive的安装配置及测试

目录

一、数据库MySQL安装

[1. 检查操作系统是否有MySQL安装残留](#1. 检查操作系统是否有MySQL安装残留)

[2. 删除残留的MySQL安装(使用yum)](#2. 删除残留的MySQL安装(使用yum))

[3. 安装MySQL依赖包、客户端和服务器](#3. 安装MySQL依赖包、客户端和服务器)

[4. MySQL登录账户root设置密码,密码值自定义,这里是'abc1234'](#4. MySQL登录账户root设置密码,密码值自定义,这里是‘abc1234’)

[5. 启动MySQL服务](#5. 启动MySQL服务)

[6. 登录MySQL,进入数据库操作提示符](#6. 登录MySQL,进入数据库操作提示符)

[7. 授权Hive远程登录账户,"账户"和"密码"自定义](#7. 授权Hive远程登录账户,“账户”和“密码”自定义)

[8. 创建Hive元数据数据库hive_1(可自命名,符合命名规则即可)](#8. 创建Hive元数据数据库hive_1(可自命名,符合命名规则即可))

二、Hive安装配置(使用hadoop用户)

[1. 上传压缩包apache-hive-3.1.2-bin.tar.gz到hadoop01(或者其他虚拟机)](#1. 上传压缩包apache-hive-3.1.2-bin.tar.gz到hadoop01(或者其他虚拟机))

[2. 在安装目标文件夹内解压缩安装包](#2. 在安装目标文件夹内解压缩安装包)

[3. 编辑hive配置文件hive-site.xml](#3. 编辑hive配置文件hive-site.xml)

[4. 解压并导入MySQL依赖包](#4. 解压并导入MySQL依赖包)

[5. 手动初始化元数据库(Hive2以上版本需要)](#5. 手动初始化元数据库(Hive2以上版本需要))

[6. 配置hive启动的环境变量](#6. 配置hive启动的环境变量)


一、数据库MySQL安装

使用root账户

1. 检查操作系统是否有MySQL安装残留

2. 删除残留的MySQL安装(使用yum)

3. 安装MySQL依赖包、客户端和服务器

4. MySQL登录账户root设置密码,密码值自定义,这里是'abc1234 '

5. 启动MySQL服务

6. 登录MySQL,进入数据库操作提示符

7. 授权Hive远程登录账户," 账户 "和" 密码 "自定义

8. 创建Hive元数据数据库 hive_1 (可自命名,符合命名规则即可)

二、Hive安装配置( 使用hadoop用户

1. 上传压缩包apache-hive-3.1.2-bin.tar.gz到hadoop01(或者其他虚拟机)

2. 在安装目标文件夹内解压缩安装包

3. 编辑hive配置文件hive-site.xml

(路径在hive安装目录的conf下)

第1步,先删除hive-site.xml中的大部分内容,删除后的内容如下图所示:

第2步:在<configuration>标签对中添加以下内容:

4. 解压并导入MySQL依赖包

5. 手动初始化元数据库(Hive2以上版本需要)

6. 配置hive启动的环境变量

7. 启动hive

相关推荐
小鹿学姐计算机考研35 分钟前
上海计算机考研炸了,这所学校慎报!上海大学计算机考研考情分析!
大数据
拓森(厦门)节能设备有限公司2 小时前
空调计费系统是什么,你知道吗
大数据·物联网·智能家居·空调计费·空调分户计费
小冷在努力2 小时前
elasticsearch镜像化安装部署
大数据·elasticsearch·jenkins·es
不学会Ⅳ2 小时前
Kafka-Produce客户端源码流程
分布式·kafka·php
Saniana3 小时前
Hive On Spark语法
linux·hive·hadoop·spark
隔着天花板看星星3 小时前
Hive-存储-文件格式
数据仓库·hive·hadoop
isNotNullX4 小时前
6种ETL计算引擎介绍
数据仓库·etl
bjshinegood5 小时前
什么是私域流量?私域流量为什么越来越多人做?
大数据·微信·企业微信
吃货智5 小时前
Kafka搭建(集群版)
分布式·kafka
赫萝的红苹果5 小时前
基于Redisson实现分布式锁
java·spring boot·分布式