Spark 之 HistoryServer and FsHistoryProvider

HistoryServer

a inner join with one empty side and one large side, the plan would finish and the large side is still running.

Spark HistoryServer 3.4 以后修复了这个问题

JsonProtocol

JsonProtocol 类为 HistoryServer 提供解析 eventLog 的基本工具类库。

other 选项为其提供了 基本反射功能,可以解决各类 event 事件

FsHistoryProvider

  override def start(): Unit = {
    initThread = initialize()
  }

  private[history] def initialize(): Thread = {
    if (!isFsInSafeMode()) {
      startPolling()
      null
    } else {
      startSafeModeCheckThread(None)
    }
  }
相关推荐
python资深爱好者9 分钟前
什么容错性以及Spark Streaming如何保证容错性
大数据·分布式·spark
猪猪果泡酒3 小时前
spark
spark
weixin_3077791316 小时前
PySpark实现MERGE INTO的数据合并功能
大数据·python·spark
lucky_syq2 天前
Spark算子:大数据处理的魔法棒
大数据·分布式·spark
D愿你归来仍是少年2 天前
解决Python升级导致PySpark任务异常方案
大数据·开发语言·python·spark
weixin_307779132 天前
PySpark检查两个DataFrame的数据是否一致
大数据·spark·pandas
人类群星闪耀时2 天前
数据湖与数据仓库:初学者的指南
大数据·数据仓库·spark
Java资深爱好者2 天前
如何使用Spark SQL进行复杂的数据查询和分析
大数据·sql·spark
赵渝强老师2 天前
【赵渝强老师】Spark RDD的缓存机制
大数据·缓存·spark
anqi272 天前
Linux 的基本命令
linux·开发语言·后端·spark