【分布式数据仓库Hive】Hive的安装配置及测试

目录

一、数据库MySQL安装

[1. 检查操作系统是否有MySQL安装残留](#1. 检查操作系统是否有MySQL安装残留)

[2. 删除残留的MySQL安装(使用yum)](#2. 删除残留的MySQL安装(使用yum))

[3. 安装MySQL依赖包、客户端和服务器](#3. 安装MySQL依赖包、客户端和服务器)

[4. MySQL登录账户root设置密码,密码值自定义,这里是'abc1234'](#4. MySQL登录账户root设置密码,密码值自定义,这里是‘abc1234’)

[5. 启动MySQL服务](#5. 启动MySQL服务)

[6. 登录MySQL,进入数据库操作提示符](#6. 登录MySQL,进入数据库操作提示符)

[7. 授权Hive远程登录账户,"账户"和"密码"自定义](#7. 授权Hive远程登录账户,“账户”和“密码”自定义)

[8. 创建Hive元数据数据库hive_1(可自命名,符合命名规则即可)](#8. 创建Hive元数据数据库hive_1(可自命名,符合命名规则即可))

二、Hive安装配置(使用hadoop用户)

[1. 上传压缩包apache-hive-3.1.2-bin.tar.gz到hadoop01(或者其他虚拟机)](#1. 上传压缩包apache-hive-3.1.2-bin.tar.gz到hadoop01(或者其他虚拟机))

[2. 在安装目标文件夹内解压缩安装包](#2. 在安装目标文件夹内解压缩安装包)

[3. 编辑hive配置文件hive-site.xml](#3. 编辑hive配置文件hive-site.xml)

[4. 解压并导入MySQL依赖包](#4. 解压并导入MySQL依赖包)

[5. 手动初始化元数据库(Hive2以上版本需要)](#5. 手动初始化元数据库(Hive2以上版本需要))

[6. 配置hive启动的环境变量](#6. 配置hive启动的环境变量)


一、数据库MySQL安装

使用root账户

1. 检查操作系统是否有MySQL安装残留

2. 删除残留的MySQL安装(使用yum)

3. 安装MySQL依赖包、客户端和服务器

4. MySQL登录账户root设置密码,密码值自定义,这里是'abc1234 '

5. 启动MySQL服务

6. 登录MySQL,进入数据库操作提示符

7. 授权Hive远程登录账户," 账户 "和" 密码 "自定义

8. 创建Hive元数据数据库 hive_1 (可自命名,符合命名规则即可)

二、Hive安装配置( 使用hadoop用户

1. 上传压缩包apache-hive-3.1.2-bin.tar.gz到hadoop01(或者其他虚拟机)

2. 在安装目标文件夹内解压缩安装包

3. 编辑hive配置文件hive-site.xml

(路径在hive安装目录的conf下)

第1步,先删除hive-site.xml中的大部分内容,删除后的内容如下图所示:

第2步:在<configuration>标签对中添加以下内容:

4. 解压并导入MySQL依赖包

5. 手动初始化元数据库(Hive2以上版本需要)

6. 配置hive启动的环境变量

7. 启动hive

相关推荐
青云交24 分钟前
Java 大视界 -- Java 大数据在智能医疗远程手术机器人操作数据记录与分析中的应用(342)
java·大数据·数据记录·远程手术机器人·基层医疗·跨院协作·弱网络适配
武子康1 小时前
大数据-38 Redis 分布式缓存 详细介绍 缓存、读写、旁路、穿透模式
大数据·redis·后端
时序数据说1 小时前
时序数据库的存储之道:从数据特性看技术要点
大数据·数据库·物联网·开源·时序数据库·iotdb
bxlj_jcj2 小时前
Flink时间窗口详解
大数据·flink
诗旸的技术记录与分享2 小时前
Flink-1.19.0源码详解-番外补充4-JobGraph图
大数据·flink
落霞的思绪2 小时前
使用云虚拟机搭建hadoop集群环境
大数据·hadoop·分布式
爱思德学术2 小时前
CCF发布《计算领域高质量科技期刊分级目录(2025年版)》
大数据·网络安全·自动化·软件工程
Edingbrugh.南空11 小时前
Flink自定义函数
大数据·flink