MacbookPro M1 安装Hive

前提注意⚠️⚠️⚠️

1)在安装Hive前确实需要安装MySQL,因为Hive可以使用MySQL作为元数据存储

2)在安装Hive之前,需要先安装Hadoop。Hive是一个构建在Hadoop之上的数据仓库软件,它使用Hadoop的HDFS(分布式文件系统)来存储数据,使用MapReduce来处理数据。

一:下载hive的安装包

下载链接:Index of /dist/hive,解压即可

二:配置相关文件

1.配置全局变量

输入:nano ~/.zshrc ,进行如下配置,并source ~/.zshrc使之生效

查看全局变量是否配置成功 输入hive --version,如示即可

2.配置hive与Mysql的连接信息

  1. 在mysql中建立hive的数据库,如示:
  1. 在hive的conf文件夹下新建hive-site.xml,内容如下:
  1. 将 Mysql 的 驱动 复制 到 Hive 的/lib 目录下:

4)输入命令schematool -dbType mysql -initSchema -verbose,初始化 Hive 数据库 为 Mysql 存储

三:运行hive

前提:启动mysql,hadoop

1.启动hiveserver2

hive --service hiveserver2 如图所示:

2.查看网页端 http://localhost:10002/

3.另起一个终端输入beeline -u jdbc:hive2:// 或者beeline -u jdbc:hive2://本机IP地址:10000 -n root

即可登录成功,如图所示:

四:DBeaver连接到hive

问题: 尝试连接出现报错Required field 'serverProtocolVersion' is unset!

解决:

找到 hadoop下 /etc/hadoop/core-site.xml ,其中加上以下内容,如示:

再次返回连接,DBeaver就会连接成功hive

小知识扩展:

ProxyUser是一种用户代理机制。在Hadoop中,某些操作需要特定的权限,如果一个用户(代理用户)需要代表另一个用户(目标用户)来执行这些操作,ProxyUser机制将会非常有用。这种做法使得用户在不直接暴露目标用户凭证的情况下,安全地执行任务。

ProxyUser的工作原理:

相关推荐
AM越.21 小时前
助睿:!!零代码解决!!订单利润分流数据加工o(* ̄▽ ̄*)ブ
数据仓库·笔记·etl·助睿
计算机毕业编程指导师1 天前
【计算机毕设推荐】Python+Spark卵巢癌风险数据可视化系统完整实现 毕业设计 选题推荐 毕设选题 数据分析 机器学习 数据挖掘
hadoop·python·计算机·数据挖掘·spark·毕业设计·卵巢癌
极光代码工作室1 天前
基于大数据的校园消费行为分析系统
大数据·hadoop·python·数据分析·spark
二十六画生的博客2 天前
每个subtask都提交一份快照到hdfs,会把10个小的快照合并成一个大的吗?谁来合并?
大数据·hadoop·hdfs·flink
juniperhan2 天前
Flink 系列第24篇:Flink SQL 集成维度表指南:存储选型、参数调优与实战避坑
大数据·数据仓库·sql·flink
隐于花海,等待花开2 天前
41.ABS / POW / SQRT 函数深度解析
大数据·hive
千月落2 天前
HDFS数据迁移
大数据·hadoop·hdfs
RestCloud3 天前
ETL数据质量保障:如何通过优化提升数据准确性?
数据仓库·etl·数据处理·数据传输·数据同步·数据集成平台
隐于花海,等待花开3 天前
40.RAND 函数深度解析
hive·hadoop
2501_927283584 天前
荣联汇智助力天津艺虹打造“软硬一体”智慧工厂,全流程自动化引领印刷包装行业数智变革
大数据·运维·数据仓库·人工智能·低代码·自动化