spark-submit 常用方式

1 、local 模式提交

在本地机器上使用2个CPU核心,以并行方式运行名为 spark-python.py 的 PySpark 应用程序

复制代码
spark-submit --master local[2] spark-python.py

更完整的提交命令示例

复制代码
spark-submit \
  --master local[2] \
  --name "MySparkApp" \
  --executor-memory 2g \
  --driver-memory 1g \
  spark-python.py
2、集群模式提交

spark-python.py 这个 PySpark 应用程序提交到位于 node03:7077 的 Spark 集群上,在多个工作节点上分布式并行执行"

复制代码
spark-submit --master spark://node03:7077 spark-python.py

带更多配置的集群提交

复制代码
spark-submit \
  --master spark://node03:7077 \
  --executor-memory 2g \
  --total-executor-cores 4 \
  --name "ProductionJob" \
  spark-python.py
相关推荐
大大大大晴天2 天前
Hudi Metadata Table 与 Hive Sync (HMS)怎么选?
大数据
手可摘星辰7772 天前
一次线上FlinkCDC异常排查复盘
大数据·flink
大大大大晴天2 天前
Hudi技术内幕:Metadata Table原理与实践
大数据
大大大大晴天3 天前
Hudi技术内幕:深入解析Index索引机制
大数据
阿里云大数据AI技术3 天前
Flink Forward Asia 2026 深圳启幕:Agentic Streaming for AI,开启实时智能新范式
大数据·flink
SelectDB4 天前
阶跃星辰基于 SelectDB 构建 PB 级 Agent 可观测平台
大数据·数据库·aigc
大大大大晴天7 天前
Hudi技术内幕:RecordPayload到RecordMerger
大数据
SelectDB8 天前
秒级弹性、最高降本 70%:SelectDB Serverless 如何重塑云数仓资源效率
大数据·后端·云原生
WhoAmI8 天前
MapReduce框架原理解析一:InputFormat
大数据·hadoop
WhoAmI8 天前
MapReduce框架原理解析三:OutputFormat
大数据·hadoop