spark 之 driver

driver 端 之输出文件

如果我们碰到有spark任务所有task结束了但是任务还没结束,很可能就是Driver还在不断的拷文件;

涉及参数:

复制代码
mapreduce.fileoutputcommitter.algorithm.version = 1
mapreduce.fileoutputcommitter.algorithm.version = 2

可以参考如下

https://blog.csdn.net/daoxu_hjl/article/details/108208327

相关推荐
勇往直前plus1 小时前
ElasticSearch详解(篇一)
大数据·elasticsearch·jenkins
无心水3 小时前
【分布式利器:Kafka】1、Kafka 入门:Broker、Topic、分区 3 张图讲透(附实操命令)
分布式·kafka·topic·isr·broker·分区·生产者消费者模式java实现
九皇叔叔3 小时前
Zookeeper 基础入门与应用场景解析
分布式·zookeeper·云原生
一只小青团4 小时前
Hadoop之HDFS
大数据·hadoop·分布式
ITVV4 小时前
hadoop-3.4.1 单机伪部署
大数据·linux·hadoop
小杜谈数5 小时前
企业BI建议--数据治理平台
大数据
西岭千秋雪_5 小时前
Kafka安装和使用
java·分布式·kafka·java-zookeeper
谅望者5 小时前
数据分析笔记07:Python编程语言介绍
大数据·数据库·笔记·python·数据挖掘·数据分析
qq_281317476 小时前
Kafka
分布式·kafka
中国国际健康产业博览会8 小时前
2026第35届中国国际健康产业博览会探索健康与科技的完美结合!
大数据·人工智能