spark广播表大小超过Spark默认的8GB限制

搞数据的小杰2025-07-16 17:13

报错：

org.apache.hive.service.cli.HiveSQLException: Error running query: java.util.concurrent.ExecutionException: org.apache.spark.SparkException: Cannot broadcast the table that is larger than 8GB: 10 GB

解决方案

方案1：增加广播阈值

设置参数 SET spark.sql.autoBroadcastJoinThreshold = 10485760;（10G）根据实际情况变更

方案2：禁用广播连接

设置参数 set spark.sql.autoBroadcastJoinThreshold=-1;

上一篇：日记_7.14_实际开发的进步

下一篇：cli中的@/components/utils是怎么被替换的成对应的alias的？