Spark JobHistory Server清理日志功能未生效,导致频繁挂掉

查看日志清理功能是打开的:spark.history.fs.cleaner.enabled = true,

spark.history.fs.cleaner.interval 和spark.history.fs.cleaner.maxAge使用的是默认值。

但是/user/spark/applicationHistory/ 目录下日志一直未不清理!存储的日志数量超过所允许的最大值。

缩短maxAge时间,然后重启了服务器,发现日志确实被清理了些。

但是还有大量未被清理的,有些运行时失败的spark job的日志没有被清理掉!

例如/user/spark/applicationHistory/application_XXX.inprogress

手动清理掉这些文件,spark Historyserver恢复正常!

相关推荐
会跑的葫芦怪12 分钟前
RabbitMQ全面详解:从核心概念到企业级应用
java·分布式·rabbitmq
还是大剑师兰特26 分钟前
Hadoop面试题及详细答案 110题 (71-85)-- 集群部署与运维
大数据·hadoop·大剑师·hadoop面试题
gddkxc27 分钟前
悟空 AI CRM 的回款功能:加速资金回流,保障企业财务健康
大数据·人工智能·信息可视化
派可数据BI可视化28 分钟前
商业智能BI与业务结构分析
大数据·数据仓库·信息可视化·数据分析·商业智能bi
clownAdam1 小时前
gaussdb数据库的集中式和分布式
数据库·分布式·gaussdb
_清浅1 小时前
大数据平台基础(Hadoop大数据原理与应用)
大数据·hadoop·分布式
乐迪信息1 小时前
乐迪信息:煤矿堆煤隐患难排查?AI摄像机实时监控与预警
大数据·人工智能·算法·安全·视觉检测
心止水j4 小时前
spark
javascript·数据库·spark
翰林小院5 小时前
【RabbitMQ】 RabbitMQ Overview
分布式·rabbitmq
Hello.Reader7 小时前
Flink Checkpoint 通用调优方案三种画像 + 配置模板 + 容量估算 + 巡检脚本 + 告警阈值
大数据·flink