【spark实战:报错】spark序列化报错:Kryo serialization failed: Buffer overflow

文章目录

spark序列化报错

scala 复制代码
 org.apache.spark.SparkException: Kryo serialization failed: Buffer overflow. Available: 0, required: 61186304. To avoid this, increase spark.kryoserializer.buffer.max value.
        at org.apache.spark.serializer.KryoSerializerInstance.serialize(KryoSerializer.scala:300)
        at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:313)
        at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
        at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
        at java.lang.Thread.run(Thread.java:745)

问题解决

the problem is that kryo does not have enough room in its buffer.

  • You should be adjusting spark.kryoserializer.buffer.max in your properties file,
  • or use --conf "spark.kryoserializer.buffer.max=128m" in your spark-submit command.
相关推荐
m0_7482475521 分钟前
重学SpringBoot3-整合 Elasticsearch 8.x (二)使用Repository
大数据·elasticsearch·jenkins
姜来可期31 分钟前
【分布式数据一致性算法】Gossip协议详解
分布式
begei31 分钟前
理解vllm分布式推理服务中的多节点Multi-Node部署方式
分布式
南宫文凯35 分钟前
Hadoop-HA(高可用)机制
大数据·hadoop·分布式·hadoop-ha
乐享数科44 分钟前
乐享数科:供应链金融—三个不同阶段的融资模式
大数据·人工智能·金融
程序员古德1 小时前
《论大数据处理架构及其应用》审题技巧 - 系统架构设计师
大数据·应用·论文写作·lambda架构·处理架构
小赖同学啊2 小时前
jmeter 与大数据生态圈中的服务进行集成
大数据·jmeter
闲人编程3 小时前
Spark单机快速入门:从部署到数据分析实战
大数据
一个假的前端男3 小时前
RabbitMQ 消息队列
分布式·rabbitmq
liruiqiang053 小时前
DDD - 整洁架构
分布式·微服务·架构