MacbookPro M1 安装Hive

Oceanside_yh2024-12-18 0:00

前提注意⚠️⚠️⚠️

1）在安装Hive前确实需要安装MySQL，因为Hive可以使用MySQL作为元数据存储

2）在安装Hive之前，需要先安装Hadoop。Hive是一个构建在Hadoop之上的数据仓库软件，它使用Hadoop的HDFS（分布式文件系统）来存储数据，使用MapReduce来处理数据。

一：下载hive的安装包

下载链接：Index of /dist/hive，解压即可

输入：nano ~/.zshrc ,进行如下配置，并source ~/.zshrc使之生效

查看全局变量是否配置成功输入hive --version,如示即可

4）输入命令schematool -dbType mysql -initSchema -verbose,初始化 Hive 数据库为 Mysql 存储

前提：启动mysql,hadoop

1.启动hiveserver2

hive --service hiveserver2 如图所示：

3.另起一个终端输入beeline -u jdbc:hive2:// 或者beeline -u jdbc:hive2://本机IP地址:10000 -n root

即可登录成功，如图所示：

问题：尝试连接出现报错Required field 'serverProtocolVersion' is unset!

解决：

找到 hadoop下 /etc/hadoop/core-site.xml ，其中加上以下内容，如示：

再次返回连接，DBeaver就会连接成功hive

小知识扩展：

ProxyUser是一种用户代理机制。在Hadoop中，某些操作需要特定的权限，如果一个用户(代理用户)需要代表另一个用户(目标用户)来执行这些操作，ProxyUser机制将会非常有用。这种做法使得用户在不直接暴露目标用户凭证的情况下，安全地执行任务。

ProxyUser的工作原理：