spark sql 优化

红烛暗盗梦2024-09-04 10:49

配置比例内存 : core = 1:2
增加 core 数可以增加执行任务的线程数
计算有大表，并发生shuffle 时，生成的任务数是由spark.sql.shuffle.partitions 决定的，所以针对大表shuffle ，要增加spark.sql.shuffle.partitions 配置值，不然有很多core 处于空闲状态

上一篇：基于SSM+Vue+MySQL的高校课程评价管理系统

下一篇：Python读取Excel数据教程 - 详细版

热门推荐

01GitHub 镜像站点 02【保姆级教程】免费使用Gemini3的5种方法！免翻墙/国内直连 03BongoCat - 跨平台键盘猫动画工具 04UV安装并设置国内源 05安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口（持续更新）06Google Antigravity：无法登录？早期错误、登录修复和用户反馈指南 07Linux下V2Ray安装配置指南 08全球最强模型Grok4，国内已可免费使用！（附教程）09Labelme从安装到标注：零基础完整指南 10Spring Boot 4.0 发布总结：新特性、依赖变更与升级指南