Hive 安装

目录

[Hive 安装](#Hive 安装)

[Hive 安装地址](#Hive 安装地址)

[Hive 安装部署](#Hive 安装部署)

[安装 Hive](#安装 Hive)

[启动并使用 Hive](#启动并使用 Hive)


Hive 安装

Hive 安装地址

1)Hive 官网地址

Apache Hivehttp://hive.apache.org/

2)文档查看地址

GettingStarted - Apache Hive - Apache Software Foundationhttps://cwiki.apache.org/confluence/display/Hive/GettingStarted

3)下载地址

Index of /dist/hivehttp://archive.apache.org/dist/hive/

4)GitHub 地址

https://github.com/apache/hivehttps://github.com/apache/hive

Hive 安装部署

安装 Hive

  1. apache-hive-3.1.3-bin.tar.gz 上传到 Linux 的 /opt/software 目录下

  2. 解压 apache-hive-3.1.3-bin.tar.gz/opt/module/ 目录下面

    复制代码
    [lzl@hadoop12 software]$ tar -zxvf /opt/software/apache-hive-3.1.3-bin.tar.gz -C /opt/module/
  3. 修改 apache-hive-3.1.3-bin.tar.gz 的名称为 hive

    复制代码
    [lzl@hadoop12 software]$ mv /opt/module/apache-hive-3.1.3-bin/ /opt/module/hive
  4. 修改 /etc/profile.d/my_env.sh,添加环境变量

    复制代码
    [lzl@hadoop12 software]$ sudo vim /etc/profile.d/my_env.sh

    (1)添加内容

    复制代码
    # HIVE_HOME
    export HIVE_HOME=/opt/module/hive
    export PATH=$PATH:$HIVE_HOME/bin

    (2)source 一下

    复制代码
    [lzl@hadoop12 hive]$ source /etc/profile.d/my_env.sh
  5. 初始化元数据库(默认是 Derby 数据库)

    复制代码
    [lzl@hadoop12 hive]$ bin/schematool -dbType derby -initSchema

启动并使用 Hive

  1. 启动 Hive

    复制代码
    [lzl@hadoop12 hive]$ bin/hive
  2. 使用 Hive

    sql 复制代码
    hive> show databases;
    hive> show tables;
    hive> create table stu(id int, name string);
    hive> insert into stu values(1,"ss");
    hive> select * from stu;

    观察 HDFS 的路径 /user/hive/warehouse/stu,体会 Hive 与 Hadoop 之间的关系。

    • Hive 中的表在 Hadoop 中是目录;
    • Hive 中的数据在 Hadoop 中是文件。
  3. 在 XShell 窗口中开启另一个窗口开启 Hive,在 /tmp/lzl 目录下监控 hive.log 文件

    sql 复制代码
    [lzl@hadoop12 lzl]$ tail -f hive.log
    sql 复制代码
    Caused by: ERROR XSDB6: Another instance of Derby may have already booted the database /opt/module/hive/metastore_db.
    
    at org.apache.derby.iapi.error.StandardException.newException(Unknown Source)
    at org.apache.derby.iapi.error.StandardException.newException(Unknown Source)
    at org.apache.derby.impl.store.raw.data.BaseDataFileFactory.privGetJBMSLockOnDB(Unknown Source)
    at org.apache.derby.impl.store.raw.data.BaseDataFileFactory.run(Unknown Source)
    ...

    原因在于 Hive 默认使用的元数据库为 Derby。Derby 数据库的特点是同一时间只允许一个客户端访问。如果多个 Hive 客户端同时访问,就会报错。由于在企业开发中,都是多人协作开发,需要多客户端同时访问 Hive,怎么解决呢?我们可以将 Hive 的元数据改为用 MySQL 存储,MySQL 支持多客户端同时访问。

  4. 首先退出 Hive 客户端。然后在 Hive 的安装目录下将 derby.logmetastore_db 删除,顺便将 HDFS 上目录删除

    sql 复制代码
    hive> quit;
    sql 复制代码
    [lzl@hadoop12 hive]$ rm -rf derby.log metastore_db
    [lzl@hadoop12 hive]$ hadoop fs -rm -r /user
  5. 删除 HDFS 中 /user/hive/warehouse/stu 中的数据

相关推荐
翻斗花园牛图图-4 分钟前
MySQL——表的操作
数据库·mysql
August_._5 分钟前
【MySQL】触发器、日志、锁机制 深度解析
java·大数据·数据库·人工智能·后端·mysql·青少年编程
拾忆,想起15 分钟前
超时重传 vs 快速重传:TCP双保险如何拯救网络丢包?
java·开发语言·网络·数据库·网络协议·tcp/ip·php
python15628 分钟前
谷歌推出Nano Banana,全新图像编辑模型
数据库
Java 码农32 分钟前
MySQL索引添加与删除方法详解
数据库·mysql
正在走向自律38 分钟前
电科金仓KingbaseES数据库全面语法解析与应用实践
数据库·国产数据库·kingbasees·数据定义语言ddl·数据操作语言dml·kingbasees语法
B站_计算机毕业设计之家1 小时前
大数据YOLOv8无人机目标检测跟踪识别系统 深度学习 PySide界面设计 大数据 ✅
大数据·python·深度学习·信息可视化·数据挖掘·数据分析·flask
web安全工具库1 小时前
Linux进程的:深入理解子进程回收与僵尸进程
java·linux·数据库
麦聪聊数据1 小时前
大数据与云原生数据库中的 SQL2API:优化跨平台数据访问与查询
数据库·sql·云原生
虚伪的空想家1 小时前
记录次etcd故障,fatal error: bus error
服务器·数据库·k8s·etcd