Spark SQL读写Hive Table部署

个人博客地址:Spark SQL读写Hive Table部署 | 一张假钞的真实世界

官网参考文档:Hive Tables

本文使用的组件版本如下:

  • Spark 3.1.2
  • Hive 3.1.2

第一步:Hive部署

在所有Worker节点上部署Hive。主要是使用Hive下面的libs。

第二步:Spark CLASSPATH

在${SPARK_HOME}/conf/spark-env.sh中添加以下内容:

export SPARK_DIST_CLASSPATH=$(hadoop classpath)

第三步:编译Spark

编译的目的是支持Hive。

./dev/make-distribution.sh --tgz -Phive -Phive-thriftserver -Pyarn -Dhadoop.version=3.2.2 -Phadoop-provided

第四步:部署Spark On Yarn

部署过程比较简单。部署过程遇到的问题参见另外一篇博文:Spark on YARN部署

第五步:兼容Hive 3.1.2

  • 将hive-site.xml复制到spark配置目录下。

  • 在配置文件spark-defaults.conf中添加以下内容。假设Hive安装目录为:/opt/hive。

    spark.sql.hive.metastore.version 3.1.2
    spark.sql.hive.metastore.jars path
    spark.sql.hive.metastore.jars.path file:///opt/hive/lib/*.jar

注意:这些Jar包需要使用Hive 3.1.2版本的。

相关推荐
m0_748247806 小时前
Python连接SQL SEVER数据库全流程
数据库·python·sql
PawSQL8 小时前
推理模型对SQL理解能力的评测:DeepSeek r1、GPT-4o、Kimi k1.5和Claude 3.7 Sonnet
java·数据库·人工智能·sql·sql优化·pawsql·deepseek
*星星之火*8 小时前
【GPT入门】第12课 FunctionCall 生成数据库sql代码
数据库·sql·gpt
爱学习的小王!10 小时前
有关MyBatis的动态SQL
java·笔记·sql·学习·mybatis
王嘉俊92510 小时前
MySQL 入门笔记
数据库·笔记·sql·mysql·adb
时雨h10 小时前
Spring MVC 详细分层和微服务
java·数据结构·数据库·sql
小技工丨11 小时前
Flink之SQL join
数据库·sql·flink
乙卯年QAQ15 小时前
【Hive】Hive安装
数据仓库·hive·hadoop
andrew_121915 小时前
暑期第一面oωo, TME一面面经
java·后端·sql·mysql·面试
AAEllisonPang15 小时前
Spark性能优化深度剖析:十大实战策略与案例解析
大数据·性能优化·spark