Spark作业串行与并行提交job

Mint62023-11-19 15:25

在Scala中，您可以以串行和并行的方式提交Spark作业。看看如何使用for和par.foreach构造对应的例子。

串行Spark作业（使用`for`）

scala 复制代码

// 串行Spark作业设置
for (tag <- tags) {
  spark.sparkContext.setJobGroup(tag.toString, s"Tag: $tag")

  // 为每个标签执行Spark操作
}

并行Spark作业（使用par.foreach）

scala 复制代码

// 并行Spark作业设置
tags.par.foreach { tag =>
  spark.sparkContext.setJobGroup(tag.toString, s"Tag: $tag")

  // 并行执行每个标签的Spark操作
}

关键区别

for用于顺序处理，而par.foreach允许并行处理。

上一篇：02.webpack中多文件打包

下一篇：2023.11.17 hadoop之HDFS进阶

热门推荐

01GitHub 镜像站点 02UV安装并设置国内源 03综合整理：pdf预览显示：你尝试预览的文件可能对你的计算机有害。如果你信任此文件以及其来源，请打开此文件以看其内容，如何解决以正常预览文件 04Linux下V2Ray安装配置指南 05BongoCat - 跨平台键盘猫动画工具 06安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口（持续更新）07npm使用国内淘宝镜像的方法 08jdk21下载、安装（Windows、Linux、macOS）09《大数据技术原理与应用》实验报告三熟悉HBase常用操作 10PyCharm 社区版全平台安装指南