记录一个hive中跑insert语句说没创建spark客户端的问题

【背景说明】

我目前搭建离线数仓,并将hive的执行引擎改成了Spark,在将ods层的数据装载到dim层,执行insert语句时报如下错误

【报错】

[42000][40000] Error while compiling statement: FAILED: SemanticException Failed to get a spark session: org.apache.hadoop.hive.ql.metadata.HiveException: Failed to create Spark client for Spark session e1e64eb2-bfa8-4e3f-8e3a-d37b88a92c86

这个错误表示Hive无法为Spark会话创建Spark客户端,可能是由于Spark会话创建失败导致的。

【原因】

经过排查,发现导致该问题的原因是当队列资源达到100%后,如果短期内都没有任务空余资源释放出来提供给创建 sparksession使用,将会导致任务失败而抛出这个异常 。

【解决】

加大client连接时间间隔;

修改hive的配置文件hive-site.xml

<!--Hive和Spark连接超时时间-->
<property>
    <name>hive.spark.client.connect.timeout</name>
    <value>100000ms</value>
</property>

注意注意:每次改完这个配置文件需要重启hiveserver2,我封装了这个脚本

hi.sh stop
hi.sh start

再重跑insert

相关推荐
红队it17 分钟前
【数据分析大屏】基于Django+Vue汽车销售数据分析可视化大屏(完整系统源码+数据库+开发笔记+详细部署教程+虚拟机分布式启动教程)✅
python·数据分析·spark·汽车·大屏端
不爱学习的小枫28 分钟前
spark常见的submit参数
大数据·分布式·spark
闯闯桑1 小时前
Hive 中用于小文件合并的配置参数
数据仓库·hive·hadoop
weixin_3077791314 小时前
PySpark实现导出两个包含多个Parquet数据文件的S3目录里的对应值的差异值分析
python·数据分析·spark·云计算
月亮月亮要去太阳14 小时前
Hadoop、Hive、Spark的关系
hive·hadoop·spark
Dragon--Z18 小时前
本地部署Hive集群
数据仓库·hive·hadoop
Arbori_2621520 小时前
大数据 spark hive 总结
大数据·hive·spark
想做富婆1 天前
面试:hive的优化, 4个by, 存储过程和自定义函数
数据仓库·hive·hadoop
宅小海1 天前
配置Hadoop集群
linux·运维·服务器·spark
qq_257379591 天前
Sqoop和Hive数据仓库速查笔记
数据仓库·hive·sqoop