【分布式数据仓库Hive】Hive的安装配置及测试

目录

一、数据库MySQL安装

[1. 检查操作系统是否有MySQL安装残留](#1. 检查操作系统是否有MySQL安装残留)

[2. 删除残留的MySQL安装(使用yum)](#2. 删除残留的MySQL安装(使用yum))

[3. 安装MySQL依赖包、客户端和服务器](#3. 安装MySQL依赖包、客户端和服务器)

[4. MySQL登录账户root设置密码,密码值自定义,这里是'abc1234'](#4. MySQL登录账户root设置密码,密码值自定义,这里是‘abc1234’)

[5. 启动MySQL服务](#5. 启动MySQL服务)

[6. 登录MySQL,进入数据库操作提示符](#6. 登录MySQL,进入数据库操作提示符)

[7. 授权Hive远程登录账户,"账户"和"密码"自定义](#7. 授权Hive远程登录账户,“账户”和“密码”自定义)

[8. 创建Hive元数据数据库hive_1(可自命名,符合命名规则即可)](#8. 创建Hive元数据数据库hive_1(可自命名,符合命名规则即可))

二、Hive安装配置(使用hadoop用户)

[1. 上传压缩包apache-hive-3.1.2-bin.tar.gz到hadoop01(或者其他虚拟机)](#1. 上传压缩包apache-hive-3.1.2-bin.tar.gz到hadoop01(或者其他虚拟机))

[2. 在安装目标文件夹内解压缩安装包](#2. 在安装目标文件夹内解压缩安装包)

[3. 编辑hive配置文件hive-site.xml](#3. 编辑hive配置文件hive-site.xml)

[4. 解压并导入MySQL依赖包](#4. 解压并导入MySQL依赖包)

[5. 手动初始化元数据库(Hive2以上版本需要)](#5. 手动初始化元数据库(Hive2以上版本需要))

[6. 配置hive启动的环境变量](#6. 配置hive启动的环境变量)


一、数据库MySQL安装

使用root账户

1. 检查操作系统是否有MySQL安装残留

2. 删除残留的MySQL安装(使用yum)

3. 安装MySQL依赖包、客户端和服务器

4. MySQL登录账户root设置密码,密码值自定义,这里是'abc1234 '

5. 启动MySQL服务

6. 登录MySQL,进入数据库操作提示符

7. 授权Hive远程登录账户," 账户 "和" 密码 "自定义

8. 创建Hive元数据数据库 hive_1 (可自命名,符合命名规则即可)

二、Hive安装配置( 使用hadoop用户

1. 上传压缩包apache-hive-3.1.2-bin.tar.gz到hadoop01(或者其他虚拟机)

2. 在安装目标文件夹内解压缩安装包

3. 编辑hive配置文件hive-site.xml

(路径在hive安装目录的conf下)

第1步,先删除hive-site.xml中的大部分内容,删除后的内容如下图所示:

第2步:在<configuration>标签对中添加以下内容:

4. 解压并导入MySQL依赖包

5. 手动初始化元数据库(Hive2以上版本需要)

6. 配置hive启动的环境变量

7. 启动hive

相关推荐
小嵌同学6 分钟前
Linux:malloc背后的实现细节
大数据·linux·数据库
IT毕设梦工厂1 小时前
大数据毕业设计选题推荐-基于大数据的国家基站整点数据分析系统-Hadoop-Spark-数据可视化-BigData
大数据·hadoop·spark·毕业设计·源码·数据可视化
江瀚视野2 小时前
苹果要在抖音上卖iPhone了?苹果看上了抖音什么?
大数据
微三云-轩2 小时前
区块链系统:解决549 亿元积分商城是否违法的问题
大数据·小程序·重构·区块链·生活
项目題供诗2 小时前
Hadoop(八)
大数据·hadoop·分布式
在未来等你3 小时前
Kafka面试精讲 Day 7:消息序列化与压缩策略
大数据·分布式·面试·kafka·消息队列
在未来等你3 小时前
Kafka面试精讲 Day 10:事务机制与幂等性保证
大数据·分布式·面试·kafka·消息队列
武子康3 小时前
大数据-91 Spark广播变量:高效共享只读数据的最佳实践 RDD+Scala编程
大数据·后端·spark
deepwater_zone3 小时前
大数据(非结构化数据,Spark,MongoDB)
大数据
DreamNotOver3 小时前
基于Spark的中文文本情感分析系统研究
大数据·分布式·spark·情感分析