Spark学习——不同模式下执行脚本

举个简单的例子:使用spark官方用例"取pi值"

一、local模式

进入spark目录执行后台命令:

powershell 复制代码
bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master local[*] \
./examples/jars/spark-examples_2.12-3.2.1.jar \
10

运行结果

二、yarn模式

由于默认情况下,Spark作业只有在运行是可以通过web UI进行查看执行情况,任务一旦执行完,就看不了了,所以为了避免这种情况,我们通过配置历史进程将历史记录保存起来,仍可以在spark上查看。
【注意】:hadoop 3.0 端口号8020要改为 9000

1、配置spark-default.conf

spark.eventLog.enabled true

spark.eventLog.dir hdfs://hadoop100:9000/directory

spark.yarn.historyServer.address=hadoop100:18080

spark.history.ui.port=18080

2、配置spark-env.sh

export SPARK_HISTORY_OPTS="

-Dspark.history.ui.port=18080

-Dspark.history.fs.logDirectory=hdfs://hadoop100:9000/directory

-Dspark.history.retainedApplications=30"

3、开启历史进程

sbin/start-history-server.sh

进入spark目录执行后台命令:

powershell 复制代码
bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master yarn \
./examples/jars/spark-examples_2.12-3.2.1.jar \
10

控制台运行结果:

可以通过yarn上的历史记录查到spark的执行记录

会自动跳转到spark的界面,更方便

相关推荐
Lucky me.几秒前
Cloud code完整命令手册
大数据·elasticsearch·搜索引擎
大大大大晴天️2 分钟前
Flink:Keyed State vs Operator State 原理与实践
大数据·flink
万岳科技程序员小金3 分钟前
大健康私域直播APP开发解决方案:电商直播带货系统源码功能解析
大数据·直播带货软件开发·私域直播系统源码·私域直播平台搭建·私域直播app开发·直播带货平台搭建
南境十里·墨染春水6 分钟前
linux学习进展 git详解
linux·git·学习
云栖梦泽在7 分钟前
AI安全入门:AI系统被攻击的常见场景与应对思路
大数据·人工智能·安全
eastyuxiao21 分钟前
第六章 AI+数字孪生融合技术
大数据·人工智能·数字孪生
sunxunyong23 分钟前
Doris数据网关限制
大数据
小新同学^O^34 分钟前
简单学习 --> 单例模式
java·学习·多线程
水火既济__37 分钟前
大数据hive_mr压缩问题
大数据·hive·mr
这个名字先用着1 小时前
形位公差速查详解
学习·汽车·制造