spark-submit 常用方式

1 、local 模式提交

在本地机器上使用2个CPU核心,以并行方式运行名为 spark-python.py 的 PySpark 应用程序

复制代码
spark-submit --master local[2] spark-python.py

更完整的提交命令示例

复制代码
spark-submit \
  --master local[2] \
  --name "MySparkApp" \
  --executor-memory 2g \
  --driver-memory 1g \
  spark-python.py
2、集群模式提交

spark-python.py 这个 PySpark 应用程序提交到位于 node03:7077 的 Spark 集群上,在多个工作节点上分布式并行执行"

复制代码
spark-submit --master spark://node03:7077 spark-python.py

带更多配置的集群提交

复制代码
spark-submit \
  --master spark://node03:7077 \
  --executor-memory 2g \
  --total-executor-cores 4 \
  --name "ProductionJob" \
  spark-python.py
相关推荐
小C8065 分钟前
【Starrocks + Hive 】BitMap + 物化视图 实战记录
大数据
西格电力科技2 小时前
面向工业用户的绿电直连架构适配技术:高可靠与高弹性的双重设计
大数据·服务器·人工智能·架构·能源
beijingliushao3 小时前
105-Spark之Standalone HA环境搭建过程
大数据·spark
五阿哥永琪3 小时前
Git 开发常用命令速查手册
大数据·git·elasticsearch
毅硕科技4 小时前
毅硕HPC | NVIDIA DGX Spark 万字硬核评测:将AI超级工厂带上桌面
功能测试·spark·hpc
数字会议深科技4 小时前
深科技 | 高端会议室效率升级指南:无纸化会议系统的演进与价值
大数据·人工智能·会议系统·无纸化·会议系统品牌·综合型系统集成商·会议室
容智信息4 小时前
容智Report Agent智能体驱动财务自动化,从核算迈向价值创造
大数据·运维·人工智能·自然语言处理·自动化·政务
神算大模型APi--天枢6464 小时前
全栈自主可控:国产算力平台重塑大模型后端开发与部署生态
大数据·前端·人工智能·架构·硬件架构
每日学点SEO5 小时前
「网站新页面冲进前10名成功率下降69%」:2025 年SEO竞争格局分析
大数据·数据库·人工智能·搜索引擎·chatgpt
写代码的【黑咖啡】6 小时前
大数据建模中的模型
大数据