头歌:Spark任务提交

第1关:spark-submit提交

任务描述

相关知识

spark-submit参数

计算圆周率

编程要求

测试说明

任务描述

本关任务:学会将程序提交到集群上执行。

相关知识

为了完成本关任务,你需要掌握:1.了解spark-submit的参数。2.学会提交Spark程序在集群运行。

课程视频《spark-submit提交》

spark-submit参数

使用格式:

复制代码
./bin/spark-submit
  --class
  --master
  --deploy-mode
  --conf
  ... # other options
  application-jar

计算圆周率

复制代码
cd /opt/spark/dist/bin
./spark-submit 
--master local 
--class org.apache.spark.examples.SparkPi
/opt/spark/dist/examples/jars/spark-examples_2.11-2.2.0.jar
./spark-submit --master 本地模式 --class 程序运行的主类名 xxx.jar 

编程要求

根据提示,在右侧编辑器补充代,将程序提交到spark上执行。

测试说明

平台会对你编写的代码进行测试:

jar包所在位置:

/root/project.jar

(点击测评的时候root目录下会有project.jar)

主类:Student

提交模式:local

预期输出:

(bj,88)(sh,67)(gz,92).

复制代码
#!/bin/bash

cp -r  Spark/SparkRDD/target/project.jar /root
cd /opt/spark/dist/bin
#********** Begin **********#

./spark-submit \
--master local \
--class Student \
/root/project.jar


#********** End **********#

这段脚本首先将 project.jar 复制到 /root 目录下,然后切换到 /opt/spark/dist/bin 目录。在 begin 和 end 之间,使用 spark-submit 命令提交 Spark 程序,其中 --master local 指定了本地模式,--class Student 指定了主类为 Student,最后指定了 jar 包的路径为 /root/project.jar。

相关推荐
weixin_3077791336 分钟前
PySpark实现ABC_manage_channel逻辑
开发语言·python·spark
酷爱码3 小时前
如何通过python连接hive,并对里面的表进行增删改查操作
开发语言·hive·python
Debug_TheWorld5 小时前
Hive学习
hive
Ivan陈哈哈8 小时前
Redis是单线程的,如何提高多核CPU的利用率?
数据库·redis·缓存
小马爱打代码9 小时前
SpringBoot原生实现分布式MapReduce计算
spring boot·分布式·mapreduce
瞎胡侃9 小时前
Spark读取Apollo配置
大数据·spark·apollo
悻运9 小时前
如何配置Spark
大数据·分布式·spark
头顶秃成一缕光9 小时前
Redis的主从模式和哨兵模式
数据库·redis·缓存
懒惰的橘猫9 小时前
Spark集群搭建之Yarn模式
大数据·分布式·spark
观无10 小时前
Redis安装及入门应用
数据库·redis·缓存