ubantu安装配置hive

在Ubuntu系统上安装Hive通常涉及几个步骤,包括安装Java(因为Hive依赖于Java),安装Hadoop,然后安装Hive本身。以下是一个基本的步骤指南:

  1. 安装Java

首先,确保你的系统上安装了Java。你可以通过运行以下命令来检查Java是否已安装:

java -version

如果未安装,你可以通过以下命令安装OpenJDK:

sudo apt update

sudo apt install openjdk-8-jdk

  1. 安装Hadoop

在安装Hive之前,你需要确保Hadoop已经正确安装。你可以从Apache官网下载Hadoop,或者使用apt包管理器(如果你使用的是Ubuntu的Hadoop PPA仓库)。这里以使用apt为例:

sudo apt update

sudo apt install hadoop

确保Hadoop的环境变量(如HADOOP_HOME)设置正确,并且在~/.bashrc或/etc/profile中添加:

export HADOOP_HOME=/usr/lib/hadoop

export PATH=PATH:PATH:PATH:HADOOP_HOME/bin:$HADOOP_HOME/sbin

然后,运行source ~/.bashrc来使更改生效。

  1. 安装Hive
    使用Apache官网下载安装

访问Apache Hive下载页面。

下载与你的Hadoop版本兼容的Hive版本。例如,如果你使用的是Hadoop 3.x,下载对应版本的Hive。

解压下载的文件到你的系统中的适当目录,例如/usr/local/hive。

设置环境变量:

export HIVE_HOME=/usr/local/hive

export PATH=PATH:PATH:PATH:HIVE_HOME/bin

运行source ~/.bashrc使更改生效。

使用apt(如果可用)

对于某些版本的Ubuntu,你可能可以通过添加PPA仓库来安装Hive。首先,添加PPA仓库:

sudo apt-add-repository ppa:bigtop/ppa

sudo apt update

然后,安装Hive:

sudo apt install hive

  1. 配置Hive

编辑Hive的配置文件hive-site.xml(通常位于$HIVE_HOME/conf目录下),确保它正确配置了Hadoop的相关信息。例如:

xml 复制代码
<configuration>
    <property>
        <name>javax.jdo.option.ConnectionURL</name>
        <value>jdbc:derby:;databaseName=$HIVE_HOME/metastore_db;create=true</value>
    </property>
    <property>
        <name>hive.metastore.warehouse.dir</name>
        <value>/user/hive/warehouse</value>
    </property>
    <property>
        <name>hive.metastore.uris</name>
        <value>thrift://localhost:9083</value> <!-- 如果使用远程元数据服务器 -->
    </property>
</configuration>
  1. 初始化Hive元数据库并启动Hive服务

初始化元数据库:

schematool -initSchema -dbType derby

或者,如果你使用的是MySQL等其他数据库,你需要先创建数据库并配置好连接。

启动Hive服务:

hive --service metastore & # 在后台启动元数据服务器(如果需要)

hive --service hiveserver2 & # 在后台启动HiveServer2(如果需要)

或者,只需启动Hive CLI:

hive

这将打开Hive的命令行界面。

通过以上步骤,你应该能够在Ubuntu系统上成功安装和配置Hive。

相关推荐
这个DBA有点耶1 天前
数据迁移避坑指南:从Oracle到国产数据库的兼容性问题
数据库·数据仓库·sql·oracle·dba
灰太狼!!1 天前
数仓、接口开发常用clickhouses函数详解
数据仓库·sql·clickhouse
Daorigin_com1 天前
从“被动领罚”到“主动合规”:强监管时代下,道本科技用数字化为企业筑牢“合规生命线”
大数据·数据仓库·科技·流程图·软件构建·数据库开发·数据库架构
一个数据大开发1 天前
大模型驱动下的数据中台架构演进:从服务化到智能化
大数据·数据仓库·vscode·pycharm
阿坤带你走近大数据2 天前
Hadoop中的MapReduce介绍
大数据·hadoop·mapreduce
阿坤带你走近大数据2 天前
HiveSQL常见性能调优策略与经验
hive·sql·调优
nvd112 天前
折腾 Niri WM:手搓一个完美的多显示器下拉终端 (Drop-down Terminal)
数据仓库
QQ12958455042 天前
FERP50 - Excel以存储过程方式访问数据仓库
数据仓库·spark·excel
It's Q2 天前
Hive序列函数&&排名函数
数据仓库·hive·hadoop
Irene19912 天前
外部表(EXTERNAL_TABLE)Hive 借用数据,删表不删数据
hive·内部表·外部表