【分布式数据仓库Hive】Hive的安装配置及测试

目录

一、数据库MySQL安装

[1. 检查操作系统是否有MySQL安装残留](#1. 检查操作系统是否有MySQL安装残留)

[2. 删除残留的MySQL安装(使用yum)](#2. 删除残留的MySQL安装(使用yum))

[3. 安装MySQL依赖包、客户端和服务器](#3. 安装MySQL依赖包、客户端和服务器)

[4. MySQL登录账户root设置密码,密码值自定义,这里是'abc1234'](#4. MySQL登录账户root设置密码,密码值自定义,这里是‘abc1234’)

[5. 启动MySQL服务](#5. 启动MySQL服务)

[6. 登录MySQL,进入数据库操作提示符](#6. 登录MySQL,进入数据库操作提示符)

[7. 授权Hive远程登录账户,"账户"和"密码"自定义](#7. 授权Hive远程登录账户,“账户”和“密码”自定义)

[8. 创建Hive元数据数据库hive_1(可自命名,符合命名规则即可)](#8. 创建Hive元数据数据库hive_1(可自命名,符合命名规则即可))

二、Hive安装配置(使用hadoop用户)

[1. 上传压缩包apache-hive-3.1.2-bin.tar.gz到hadoop01(或者其他虚拟机)](#1. 上传压缩包apache-hive-3.1.2-bin.tar.gz到hadoop01(或者其他虚拟机))

[2. 在安装目标文件夹内解压缩安装包](#2. 在安装目标文件夹内解压缩安装包)

[3. 编辑hive配置文件hive-site.xml](#3. 编辑hive配置文件hive-site.xml)

[4. 解压并导入MySQL依赖包](#4. 解压并导入MySQL依赖包)

[5. 手动初始化元数据库(Hive2以上版本需要)](#5. 手动初始化元数据库(Hive2以上版本需要))

[6. 配置hive启动的环境变量](#6. 配置hive启动的环境变量)


一、数据库MySQL安装

使用root账户

1. 检查操作系统是否有MySQL安装残留

2. 删除残留的MySQL安装(使用yum)

3. 安装MySQL依赖包、客户端和服务器

4. MySQL登录账户root设置密码,密码值自定义,这里是'abc1234 '

5. 启动MySQL服务

6. 登录MySQL,进入数据库操作提示符

7. 授权Hive远程登录账户," 账户 "和" 密码 "自定义

8. 创建Hive元数据数据库 hive_1 (可自命名,符合命名规则即可)

二、Hive安装配置( 使用hadoop用户

1. 上传压缩包apache-hive-3.1.2-bin.tar.gz到hadoop01(或者其他虚拟机)

2. 在安装目标文件夹内解压缩安装包

3. 编辑hive配置文件hive-site.xml

(路径在hive安装目录的conf下)

第1步,先删除hive-site.xml中的大部分内容,删除后的内容如下图所示:

第2步:在<configuration>标签对中添加以下内容:

4. 解压并导入MySQL依赖包

5. 手动初始化元数据库(Hive2以上版本需要)

6. 配置hive启动的环境变量

7. 启动hive

相关推荐
大数据编程之光几秒前
Flink Standalone集群模式安装部署全攻略
java·大数据·开发语言·面试·flink
B站计算机毕业设计超人2 分钟前
计算机毕业设计SparkStreaming+Kafka旅游推荐系统 旅游景点客流量预测 旅游可视化 旅游大数据 Hive数据仓库 机器学习 深度学习
大数据·数据仓库·hadoop·python·kafka·课程设计·数据可视化
processflow流程图2 小时前
分布式kettle调度平台v6.4.0新功能介绍
分布式
在下不上天2 小时前
Flume日志采集系统的部署,实现flume负载均衡,flume故障恢复
大数据·开发语言·python
全栈开发圈2 小时前
干货分享|分布式数据科学工具 Xorbits 的使用
分布式
智慧化智能化数字化方案2 小时前
华为IPD流程管理体系L1至L5最佳实践-解读
大数据·华为
PersistJiao3 小时前
在 Spark RDD 中,sortBy 和 top 算子的各自适用场景
大数据·spark·top·sortby
2301_811274314 小时前
大数据基于Spring Boot的化妆品推荐系统的设计与实现
大数据·spring boot·后端
Yz98764 小时前
hive的存储格式
大数据·数据库·数据仓库·hive·hadoop·数据库开发