spark集成hive

集群使用ambari+hdp方式进行部署,集群的相关版本号如下所示:

ambari版本

Version 2.7.4.0

HDP版本

HDP-3.1.4.0

hive版本

3.1.0

spark版本

2.3.0

集群前提条件:

1.Hdp、Spark、Hive都已部署好

2.Hive数据层建好,在Hdfs生成相应各层目录,后面配置Spark访问Hive的目录,要保证这个目录存在。

spark集成hive

1.修改spark配置: Advanced spark2-defaults

spark.sql.warehouse.dir将默认值/apps/spark/warehouse 改为hive数据存储hdfs位置

/warehouse/tablespace/managed/hive

2.修改spark配置: Advanced spark2-hive-site-overrid

metastore.catalog.default 值 spark 改为 hive

  1. 修改hive配置: 到hive组件修改配置

hive.strict.managed.tables 的 true 改为 false

相关推荐
SeaTunnel7 分钟前
关于 Apache SeaTunnel 类加载器治理的一些观察与思考(欢迎讨论)
大数据·开源·apache·seatunnel·数据同步
北冥有羽Victoria9 分钟前
Django 实战:SQLite 转 MySQL 与 Bootstrap 集成
大数据·服务器·python·django·编辑器
拓端研究室10 分钟前
2026年智能网联汽车(车联网)蓝皮书:渠道整合、新能源出海与市场分化|附200+份报告PDF、数据、可视化模板汇总下载
大数据·人工智能
咕噜签名-铁蛋15 分钟前
OpenClaw 中转 API:打造安全高效的 AI 智能体调用方案
大数据·人工智能·安全
QYR-分析16 分钟前
2026车载同轴电缆行业全景分析:产品、市场与发展机遇
大数据·人工智能
嵌入式小企鹅19 分钟前
Claude开源风暴?半导体设备突破?
大数据·人工智能·学习·开源·嵌入式·半导体·ai芯片
DolphinScheduler社区21 分钟前
小白版 | Apache DolphinScheduler 本地启动指南
大数据·开源·apache·海豚调度·大数据工作流调度
科技动态31 分钟前
BOE(京东方)重磅展出搭载自研TSF第四代发光技术产品,定义“高亮广色域”柔性显示新标杆
大数据
星川皆无恙38 分钟前
Transformer学习笔记:从 Attention 核心理论到机器翻译代码项目学习实战
大数据·pytorch·笔记·深度学习·神经网络·自然语言处理·transformer
2601_955363151 小时前
技术赋能B端拓客:号码核验行业的迭代与价值升级氪迹科技法人股东号码筛选系统,阶梯式价格
大数据·人工智能