spark history server异常

现象:spark 日志文件突然新增了很多.hprof文件,

查找日志spark配置参数spark_log_dir进入日志目录:

查看historyServer日志:

bash 复制代码
Spark Command: /usr/lib/jvm/java-1.8.0/bin/java -cp /opt/apps/JINDOSDK/jindosdk-current/lib/*:/etc/taihao-apps/spark-conf/:/opt/apps/SPARK3/spark-current/jars/*:/etc/taihao-apps/hadoop-conf/ -XX:+ExitOnOutOfMemoryError -XX:OnOutOfMemoryError=kill -9 %p -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/var/log/taihao-apps/spark/ -Dlog4j.configuration=file:/etc/taihao-apps/spark-conf/spark-daemon-log4j.properties -Dspark.log.dir=/var/log/taihao-apps/spark -Dspark.log.file=spark-history-server.log -Xloggc:/var/log/taihao-apps/spark/spark-history-gc.log -XX:+IgnoreUnrecognizedVMOptions -verbose:gc -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -XX:+UseGCLogFileRotation -XX:NumberOfGCLogFiles=5 -XX:GCLogFileSize=128M -Xmx1g org.apache.spark.deploy.history.HistoryServer
========================================
java.lang.OutOfMemoryError: GC overhead limit exceeded
Dumping heap to /var/log/taihao-apps/spark/java_pid562312.hprof ...
Heap dump file created [1038934719 bytes in 4.457 secs]
#
# java.lang.OutOfMemoryError: GC overhead limit exceeded
# -XX:OnOutOfMemoryError="kill -9 %p"
#   Executing /bin/sh -c "kill -9 562312"...
(END)

发现是history Server服务一直启动oom异常

重启一下:

bash 复制代码
yarn --daemon start timelineserver

或者:
yarn-daemon start timelineserver

重启无效,

定位配置参数发现spark历史任务日志太多,一直没清理

修改配置参数:

bash 复制代码
spark.history.fs.cleaner.enabled = true

spark_history_daemon_memory = 8g

spark_thrift_daemon_memory = 4g

成功

参考链接:
https://blog.csdn.net/Mrerlou/article/details/121405408
https://www.cnblogs.com/lemonu/p/13901203.html
https://www.cnblogs.com/nortingHome/p/13984217.html

相关推荐
guizhoumen20 小时前
2026年建站系统推荐及选项指南
大数据·运维·人工智能
蘑菇物联20 小时前
蘑菇物联入选“预见·2026”年度双榜,以AI技术赋能制造业绿色转型!
大数据·人工智能
跨境小技20 小时前
Reddit营销:如何在Reddit写出“像用户一样”的营销贴?、
大数据
m0_4665252920 小时前
东软与葫芦岛市民政局签约 共建智慧养老服务平台
大数据·人工智能
乐居生活官21 小时前
2026五大功能全面的电商软件测评:打造全链路智能运营体系
大数据·人工智能
没有bug.的程序员21 小时前
Spring Boot 事务管理:@Transactional 失效场景、底层内幕与分布式补偿实战终极指南
java·spring boot·分布式·后端·transactional·失效场景·底层内幕
ws20190721 小时前
智驾与电池双线突破?AUTO TECH China 2026广州新能源汽车展解码产业新局
大数据·人工智能·科技·汽车
2501_9419820521 小时前
企业微信外部群精准运营:API 主动推送消息开发指南
大数据·人工智能·企业微信
LuminescenceJ21 小时前
GoEdge 开源CDN 架构设计与工作原理分析
分布式·后端·网络协议·网络安全·rpc·开源·信息与通信
2501_911067661 天前
光能筑底,智联全城——叁仟智慧太阳能路灯杆重构城市基础设施新生态
大数据·人工智能·重构