Hive安装教程

Hive安装教程


文章目录


写在前面

  • Linux版本:CentOS7.5
  • Hive版本:Hive-3.1.2

安装

下载

下载地址:http://archive.apache.org/dist/hive/

安装部署

安装Hive
  • 把apache-hive-3.1.2-bin.tar.gz上传到linux的/export/software目录下
  • 解压apache-hive-3.1.2-bin.tar.gz到/export/module/目录下面
shell 复制代码
[whybigdata@wbd01 software]$ tar -zxvf /export/software/apache-hive-3.1.2-bin.tar.gz -C /export/module/
  • 修改/etc/profile.d/my_env.sh,添加环境变量
shell 复制代码
[whybigdata@wbd01 software]$ sudo vim /etc/profile.d/my_env.sh

添加内容

shell 复制代码
#HIVE_HOME
export HIVE_HOME=/export/module/hive
export PATH=$PATH:$HIVE_HOME/bin
  • 解决日志Jar包冲突
shell 复制代码
[whybigdata@wbd01 software]$ mv $HIVE_HOME/lib/log4j-slf4j-impl-2.10.0.jar $HIVE_HOME/lib/log4j-slf4j-impl-2.10.0.bak
  • 初始化元数据库
shell 复制代码
[whybigdata@wbd01 hive]$ bin/schematool -dbType derby -initSchema
启动并使用Hive
  • 启动Hive
shell 复制代码
[whybigdata@wbd01 hive]$ bin/hive
  • 使用Hive
sql 复制代码
hive> show databases;
hive> show tables;
hive> create table test(id int);
hive> insert into test values(1);
hive> select * from test;
  • 在CRT窗口中开启另一个窗口开启Hive,在/tmp/whybigdata目录下监控hive.log文件

    Caused by: ERROR XSDB6: Another instance of Derby may have already booted the database /export/module/hive-3.1.2/metastore_db.
    at org.apache.derby.iapi.error.StandardException.newException(Unknown Source)
    at org.apache.derby.iapi.error.StandardException.newException(Unknown Source)
    at org.apache.derby.impl.store.raw.data.BaseDataFileFactory.privGetJBMSLockOnDB(Unknown Source)
    at org.apache.derby.impl.store.raw.data.BaseDataFileFactory.run(Unknown Source)
    ...

原因在于Hive默认使用的元数据库为 derby,开启Hive之后就会占用元数据库,且不与其他客户端共享数据,所以我们需要将Hive的元数据地址改为MySQL

MySQL安装

检查当前系统是否安装过MySQL

shell 复制代码
[whybigdata@wbd01 ~]$ rpm -qa | grep mariadb
mariadb-libs-5.5.56-2.el7.x86_64 
// TODO 如果存在通过如下命令卸载
[whybigdata @wbd01 ~]$ sudo rpm -e --nodeps  mariadb-libs

安装

  • 将MySQL安装包拷贝到/export/software目录下
shell 复制代码
[whybigdata @wbd01 software]# ll
总用量 528384
-rw-r--r--. 1 root root 609556480 3月  21 15:41 mysql-5.7.28-1.el7.x86_64.rpm-bundle.tar
  • 解压MySQL安装包
shell 复制代码
[whybigdata @wbd01 software]# tar -xf mysql-5.7.28-1.el7.x86_64.rpm-bundle.tar
  • 在安装目录下执行rpm安装
shell 复制代码
[whybigdata @wbd01 software]$ 
sudo rpm -ivh mysql-community-common-5.7.28-1.el7.x86_64.rpm
sudo rpm -ivh mysql-community-libs-5.7.28-1.el7.x86_64.rpm
sudo rpm -ivh mysql-community-libs-compat-5.7.28-1.el7.x86_64.rpm
sudo rpm -ivh mysql-community-client-5.7.28-1.el7.x86_64.rpm
sudo rpm -ivh mysql-community-server-5.7.28-1.el7.x86_64.rpm

注意:按照顺序依次执行
如果此处Linux是 最小化安装 的,在安装mysql-community-server-5.7.28-1.el7.x86_64.rpm时可能会出现如下错误

[whybigdata@wbd01 software]$ sudo rpm -ivh mysql-community-server-5.7.28-1.el7.x86_64.rpm
警告:mysql-community-server-5.7.28-1.el7.x86_64.rpm: 头V3 DSA/SHA1 Signature, 密钥 ID 5072e1f5: NOKEY
错误:依赖检测失败:
        libaio.so.1()(64bit) 被 mysql-community-server-5.7.28-1.el7.x86_64 需要
        libaio.so.1(LIBAIO_0.1)(64bit) 被 mysql-community-server-5.7.28-1.el7.x86_64 需要
        libaio.so.1(LIBAIO_0.4)(64bit) 被 mysql-community-server-5.7.28-1.el7.x86_64 需要

通过yum安装缺少的依赖,然后重新安装mysql-community-server-5.7.28-1.el7.x86_64即可

shell 复制代码
[whybigdata@wbd01 software] yum install -y libaio

初始化数据库

  • 删除/etc/my.cnf文件中datadir指向的目录下的所有内容,如果有内容的情况下:

查看datadir的值:

shell 复制代码
[mysqld]
datadir=/var/lib/mysql

删除/var/lib/mysql目录下的所有内容:

shell 复制代码
[whybigdata @wbd01 mysql]# cd /var/lib/mysql
[whybigdata @wbd01 mysql]# sudo rm -rf ./*    //注意执行命令的位置
  • 初始化数据库
shell 复制代码
[whybigdata @wbd01 export]$ sudo mysqld --initialize --user=mysql
  • 查看临时生成的root用户的密码
shell 复制代码
[whybigdata @wbd01 export]$ sudo cat /var/log/mysqld.log
  • 启动MySQL服务
shell 复制代码
[whybigdata @wbd01 export]$ sudo systemctl start mysqld
  • 登录MySQL数据库
shell 复制代码
[whybigdata @wbd01 export]$ mysql -uroot -p
Enter password:   输入临时生成的密码
   登录成功.
  • 必须先修改root用户的密码,否则执行其他的操作会报错
sql 复制代码
mysql> set password = password("newPassword");
  • 修改mysql库下的user表中的root用户允许任意ip连接
sql 复制代码
mysql> update mysql.user set host='%' where user='root';
mysql> flush privileges;

Hive元数据配置到MySQL

拷贝驱动

将MySQL的JDBC驱动拷贝到Hive安装目录的lib目录下

shell 复制代码
[whybigdata@wbd01 software]$ cp /export/software/mysql-connector-java-5.1.37.jar $HIVE_HOME/lib

配置Metastore到MySQL

  • $HIVE_HOME/conf目录下新建 hive-site.xml 文件
shell 复制代码
[whybigdata@wbd01 software]$ vim $HIVE_HOME/conf/hive-site.xml

添加如下内容

xml 复制代码
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
    <!-- jdbc连接的URL -->
    <property>
        <name>javax.jdo.option.ConnectionURL</name>
        <value>jdbc:mysql://wbd01:3306/metastore?useSSL=false</value>
	</property>

    <!-- jdbc连接的Driver-->
    <property>
        <name>javax.jdo.option.ConnectionDriverName</name>
        <value>com.mysql.jdbc.Driver</value>
	</property>

	<!-- jdbc连接的username-->
    <property>
        <name>javax.jdo.option.ConnectionUserName</name>
        <value>root</value>
    </property>

    <!-- jdbc连接的password -->
    <property>
        <name>javax.jdo.option.ConnectionPassword</name>
        <value>123456</value>
	</property>

    <!-- Hive元数据存储版本的验证 -->
    <property>
        <name>hive.metastore.schema.verification</name>
        <value>false</value>
	</property>

    <!--元数据存储授权-->
    <property>
        <name>hive.metastore.event.db.notification.api.auth</name>
        <value>false</value>
    </property>

    <!-- Hive默认在HDFS的工作目录 -->
    <property>
        <name>hive.metastore.warehouse.dir</name>
        <value>/user/hive/warehouse</value>
    </property>
</configuration>
  • 登陆MySQL
shell 复制代码
[whybigdata@wbd01 software]$ mysql -uroot -p123456
  • 新建Hive元数据库
sql 复制代码
mysql> create database metastore;
mysql> quit;
  • 初始化Hive元数据库
shell 复制代码
[whybigdata@wbd01 software]$ schematool -initSchema -dbType mysql -verbose

再次启动Hive

  • 启动Hive
shell 复制代码
[whybigdata@wbd01 hive]$ bin/hive
  • 使用Hive
sql 复制代码
hive> show databases;
hive> show tables;
hive> create table test (id int);
hive> insert into test values(1);
hive> select * from test;
  • 在CRT窗口中开启另一个窗口开启Hive
sql 复制代码
hive> show databases;
hive> show tables;
hive> select * from aa;

全文结束!!!

相关推荐
weixin_307779133 小时前
Spark Streaming的背压机制的原理与实现代码及分析
大数据·python·spark
想做富婆5 小时前
Hive:复杂数据类型之Map函数
数据仓库·hive·hadoop
想做富婆7 小时前
hive:基本数据类型,关于表和列语法
大数据·hive·hadoop
梦醒沉醉7 小时前
单机伪分布Hadoop详细配置
大数据·hadoop·分布式
小Tomkk9 小时前
大数据相关职位介绍之一(数据分析,数据开发,数据产品经理,数据运营)
大数据·数据分析·数据开发·数据运营·数据产品经理
UI设计兰亭妙微9 小时前
大屏 UI 设计风格的未来趋势
大数据
乙卯年QAQ13 小时前
【Elasticsearch】Elasticsearch的查询
大数据·elasticsearch·搜索引擎
XianxinMao15 小时前
科技巨头AI投资引领未来增长
大数据·人工智能·科技
言之。15 小时前
【Spark速通】
大数据·分布式·spark