Spark 之 HistoryServer and FsHistoryProvider

HistoryServer

a inner join with one empty side and one large side, the plan would finish and the large side is still running.

Spark HistoryServer 3.4 以后修复了这个问题

JsonProtocol

JsonProtocol 类为 HistoryServer 提供解析 eventLog 的基本工具类库。

other 选项为其提供了 基本反射功能,可以解决各类 event 事件

FsHistoryProvider

复制代码
  override def start(): Unit = {
    initThread = initialize()
  }

  private[history] def initialize(): Thread = {
    if (!isFsInSafeMode()) {
      startPolling()
      null
    } else {
      startSafeModeCheckThread(None)
    }
  }
相关推荐
yumgpkpm5 小时前
Hadoop(CDH6、CDP7)在Qwen3.7大模型训练中的作用,(含部署、运行操作步骤)
大数据·hive·hadoop·分布式·zookeeper·spark·kafka
ZPC82101 天前
DGX Spark 200G 跟 100G 设备的通讯协议
大数据·分布式·spark
南屹川1 天前
【大数据】大数据处理技术栈:从采集到分析的完整链路
大数据·人工智能·hadoop·flink·spark·数据处理
r-t-H2 天前
从零开始搭建CDH-第十四章
spark·kafka·centos·cloudera
zandy10113 天前
2026 BI平台与数据中台融合架构实践:从数据烟囱到统一智能数据层
大数据·架构·spark
zhojiew3 天前
使用AWS中国区Lambda集成Glue Schema Registry消费Kafka消息的实践
大数据·spark·etl
r-t-H4 天前
从零开始搭建CDH-第十二章
linux·hive·spark·centos·hbase
zhojiew4 天前
部署DataHub并导入Glue元数据以集成DBT和Spark ETL任务中数据血缘的实践
大数据·spark·etl
WL_Aurora5 天前
大数据技术之SparkCore
大数据·前端·spark·rdd
WL_Aurora5 天前
Scala核心编程(一):Scala语言概述与快速入门
spark·scala