spark sql 优化

  1. 配置 比例内存 : core = 1:2

  2. 增加 core 数可以增加 执行任务的 线程数

  3. 计算有大表,并发生shuffle 时,生成的任务数是由spark.sql.shuffle.partitions 决定的,所以针对大表shuffle ,要增加spark.sql.shuffle.partitions 配置值,不然有很多core 处于空闲状态

相关推荐
阿部多瑞 ABU4 分钟前
铁三角:泛二次元奶头乐经济的结构分析及其人口后果
大数据·人工智能
吴卫斌10 分钟前
波动率控制仓位系列(一):满仓轮动的“过山车”困境
大数据·python·股票·量化交易
AI焦点14 分钟前
2026年AI应用架构:如何避坑并选对API聚合中转服务?
大数据·人工智能·架构
精益数智小屋32 分钟前
项目管理看板如何拆解任务进度?项目管理看板解决跨部门协作难题
大数据·人工智能·数据分析·云计算·软件工程
xcbrand37 分钟前
湖南VI设计公司排名
大数据·人工智能·python
Jiamiren44 分钟前
2026美国至6月6日当周初请失业金人数(万人)
大数据
清辞8531 小时前
产品经理需求推进流程
大数据·深度学习·学习·产品经理
极创信息3 小时前
Linux挖矿病毒深度清理实战教程,从进程隐藏、Rootkit驻留到彻底根除
java·大数据·linux·运维·安全·tomcat·健康医疗
SEO_juper3 小时前
Semrush 蓝海关键词筛选,AI 一键拓展完整词库
大数据·谷歌·seo·geo·gemini·询盘·b2b
linux修理工4 小时前
使用codebuddy学习kafka
分布式·学习·kafka