【分布式数据仓库Hive】Hive的安装配置及测试

目录

一、数据库MySQL安装

[1. 检查操作系统是否有MySQL安装残留](#1. 检查操作系统是否有MySQL安装残留)

[2. 删除残留的MySQL安装(使用yum)](#2. 删除残留的MySQL安装(使用yum))

[3. 安装MySQL依赖包、客户端和服务器](#3. 安装MySQL依赖包、客户端和服务器)

[4. MySQL登录账户root设置密码,密码值自定义,这里是'abc1234'](#4. MySQL登录账户root设置密码,密码值自定义,这里是‘abc1234’)

[5. 启动MySQL服务](#5. 启动MySQL服务)

[6. 登录MySQL,进入数据库操作提示符](#6. 登录MySQL,进入数据库操作提示符)

[7. 授权Hive远程登录账户,"账户"和"密码"自定义](#7. 授权Hive远程登录账户,“账户”和“密码”自定义)

[8. 创建Hive元数据数据库hive_1(可自命名,符合命名规则即可)](#8. 创建Hive元数据数据库hive_1(可自命名,符合命名规则即可))

二、Hive安装配置(使用hadoop用户)

[1. 上传压缩包apache-hive-3.1.2-bin.tar.gz到hadoop01(或者其他虚拟机)](#1. 上传压缩包apache-hive-3.1.2-bin.tar.gz到hadoop01(或者其他虚拟机))

[2. 在安装目标文件夹内解压缩安装包](#2. 在安装目标文件夹内解压缩安装包)

[3. 编辑hive配置文件hive-site.xml](#3. 编辑hive配置文件hive-site.xml)

[4. 解压并导入MySQL依赖包](#4. 解压并导入MySQL依赖包)

[5. 手动初始化元数据库(Hive2以上版本需要)](#5. 手动初始化元数据库(Hive2以上版本需要))

[6. 配置hive启动的环境变量](#6. 配置hive启动的环境变量)


一、数据库MySQL安装

使用root账户

1. 检查操作系统是否有MySQL安装残留

2. 删除残留的MySQL安装(使用yum)

3. 安装MySQL依赖包、客户端和服务器

4. MySQL登录账户root设置密码,密码值自定义,这里是'abc1234 '

5. 启动MySQL服务

6. 登录MySQL,进入数据库操作提示符

7. 授权Hive远程登录账户," 账户 "和" 密码 "自定义

8. 创建Hive元数据数据库 hive_1 (可自命名,符合命名规则即可)

二、Hive安装配置( 使用hadoop用户

1. 上传压缩包apache-hive-3.1.2-bin.tar.gz到hadoop01(或者其他虚拟机)

2. 在安装目标文件夹内解压缩安装包

3. 编辑hive配置文件hive-site.xml

(路径在hive安装目录的conf下)

第1步,先删除hive-site.xml中的大部分内容,删除后的内容如下图所示:

第2步:在<configuration>标签对中添加以下内容:

4. 解压并导入MySQL依赖包

5. 手动初始化元数据库(Hive2以上版本需要)

6. 配置hive启动的环境变量

7. 启动hive

相关推荐
字节跳动数据平台21 小时前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
得物技术1 天前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark
武子康1 天前
大数据-238 离线数仓 - 广告业务 Hive分析实战:ADS 点击率、购买率与 Top100 排名避坑
大数据·后端·apache hive
武子康2 天前
大数据-237 离线数仓 - Hive 广告业务实战:ODS→DWD 事件解析、广告明细与转化分析落地
大数据·后端·apache hive
大大大大晴天2 天前
Flink生产问题排障-Kryo serializer scala extensions are not available
大数据·flink
武子康4 天前
大数据-236 离线数仓 - 会员指标验证、DataX 导出与广告业务 ODS/DWD/ADS 全流程
大数据·后端·apache hive
初次攀爬者5 天前
ZooKeeper 实现分布式锁的两种方式
分布式·后端·zookeeper
武子康5 天前
大数据-235 离线数仓 - 实战:Flume+HDFS+Hive 搭建 ODS/DWD/DWS/ADS 会员分析链路
大数据·后端·apache hive
DianSan_ERP6 天前
电商API接口全链路监控:构建坚不可摧的线上运维防线
大数据·运维·网络·人工智能·git·servlet
够快云库6 天前
能源行业非结构化数据治理实战:从数据沼泽到智能资产
大数据·人工智能·机器学习·企业文件安全