【spark实战:报错】spark序列化报错:Kryo serialization failed: Buffer overflow

文章目录

spark序列化报错

scala 复制代码
 org.apache.spark.SparkException: Kryo serialization failed: Buffer overflow. Available: 0, required: 61186304. To avoid this, increase spark.kryoserializer.buffer.max value.
        at org.apache.spark.serializer.KryoSerializerInstance.serialize(KryoSerializer.scala:300)
        at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:313)
        at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
        at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
        at java.lang.Thread.run(Thread.java:745)

问题解决

the problem is that kryo does not have enough room in its buffer.

  • You should be adjusting spark.kryoserializer.buffer.max in your properties file,
  • or use --conf "spark.kryoserializer.buffer.max=128m" in your spark-submit command.
相关推荐
卷毛迷你猪4 分钟前
快速实验篇(A1)干旱气象数据上传至HDFS
大数据·hadoop·hdfs
头歌实践平台2 小时前
招聘大数据可视化
大数据·python
头歌实践平台2 小时前
Hadoop开发环境搭建
java·大数据·hadoop
Alter12303 小时前
从“力大砖飞”到“拟态共生”,新华三定义AI基础设施的系统级进化
大数据·运维·人工智能
2501_928817123 小时前
大模型如何决定推荐谁?拆解精准触达的底层算法工艺
大数据
qq_297574673 小时前
第十四篇:RabbitMQ监控与日志分析——快速排查线上问题
分布式·rabbitmq·ruby
ApacheSeaTunnel3 小时前
AI 让 SeaTunnel 读源码和调试过时了吗?
大数据·ai·开源·数据集成·seatunnel·技术分享·数据同步
TDengine (老段)3 小时前
MNode 内部机制深度解析 — SDB、事务引擎与 DDL 处理全链路
大数据·数据库·物联网·时序数据库·iot·tdengine·涛思数据
白鲸开源4 小时前
杀疯了!SeaTunnel AI CLI 解锁数据集成新玩法
大数据·人工智能·github