spark-submit 常用方式

1 、local 模式提交

在本地机器上使用2个CPU核心,以并行方式运行名为 spark-python.py 的 PySpark 应用程序

复制代码
spark-submit --master local[2] spark-python.py

更完整的提交命令示例

复制代码
spark-submit \
  --master local[2] \
  --name "MySparkApp" \
  --executor-memory 2g \
  --driver-memory 1g \
  spark-python.py
2、集群模式提交

spark-python.py 这个 PySpark 应用程序提交到位于 node03:7077 的 Spark 集群上,在多个工作节点上分布式并行执行"

复制代码
spark-submit --master spark://node03:7077 spark-python.py

带更多配置的集群提交

复制代码
spark-submit \
  --master spark://node03:7077 \
  --executor-memory 2g \
  --total-executor-cores 4 \
  --name "ProductionJob" \
  spark-python.py
相关推荐
YangYang9YangYan16 分钟前
2026中专大数据专业学习指南
大数据
yumgpkpm17 分钟前
预测:2026年大数据软件+AI大模型的发展趋势
大数据·人工智能·算法·zookeeper·kafka·开源·cloudera
无级程序员21 分钟前
大数据Hive之拉链表增量取数合并设计(主表加历史表合并成拉链表)
大数据·hive·hadoop
py小王子1 小时前
dy评论数据爬取实战:基于DrissionPage的自动化采集方案
大数据·开发语言·python·毕业设计
龙山云仓2 小时前
MES系统超融合架构
大数据·数据库·人工智能·sql·机器学习·架构·全文检索
无忧智库2 小时前
某市“十五五“知识产权大数据监管平台与全链条保护系统建设方案深度解读(WORD)
大数据·人工智能
综合热讯2 小时前
股票融资融券交易时间限制一览与制度说明
大数据·人工智能·区块链
华农DrLai2 小时前
Spark SQL Catalyst 优化器详解
大数据·hive·sql·flink·spark
Pluchon3 小时前
硅基计划4.0 算法 简单模拟实现位图&布隆过滤器
java·大数据·开发语言·数据结构·算法·哈希算法
岁岁种桃花儿3 小时前
Flink从入门到上天系列第一篇:搭建第一个Flink程序
大数据·linux·flink·数据同步