SQL_优化

1 SQL优化

(1) 数据读取

①分区裁剪:使用时只读取需要的分区.

②列裁剪:读取操作(select、where、join、group by、sort by等),不读取不需要的列,减少IO消耗.

(2) 数据筛选

①分区先过滤,区分度大的字段先过滤.

②不在筛选字段上使用函数和表达式.

(3) 分组聚合

①使用窗口函数时,排序键区分度大的放在前面.

②数据量大时,用group by替代distinct.

(4) join

①减少不必要的关联字段.

②关联字段有用函数等处理时,可先处理好字段再关联.

③关联键区分度大的先执行.

④多表关联时,能减少数据量的表先关联.

(5) 索引

合理设置索引,再使用时避免索引失效.

(6) 整体

①将复杂查询分解为多个简单查询.

②将重复计算的结果存储在变量或临时表中.

2 结构优化

(1) 字段

①减少单表字段数.

②整数尽量用短的类型.

③可用枚举或者整数代替字符串类型.

3 资源优化

①调整内存参数:如缓冲池大小、缓存大小等.

②调整连接池:优化数据库连接池的大小和配置.

4 针对性优化

优化MySQL:从单表到高阶策略的全方位优化指南-CSDN博客https://blog.csdn.net/weixin_43875878/article/details/125927373Hive_优化/问题-CSDN博客文章浏览阅读2次。①除了需要导入数据表使用textfile外,表的存储格式使用orc 和 parquet.https://blog.csdn.net/weixin_43875878/article/details/145882724

相关推荐
星辰_mya2 分钟前
利用 BeanPostProcessor 实现动态增强与框架开发
数据库
qq_416018724 分钟前
游戏与图形界面(GUI)
jvm·数据库·python
Sunshine for you6 分钟前
使用Python分析你的Spotify听歌数据
jvm·数据库·python
2401_884563246 分钟前
用Python读取和处理NASA公开API数据
jvm·数据库·python
逸Y 仙X7 分钟前
文章十一:ElasticSearch Dynamic Template详解
java·大数据·数据库·elasticsearch·搜索引擎·全文检索
2301_793804699 分钟前
用Python制作一个文字冒险游戏
jvm·数据库·python
Bdygsl11 分钟前
MySQL(3)—— 约束
数据库·mysql
dapeng287012 分钟前
用Python破解简单的替换密码
jvm·数据库·python
setmoon21413 分钟前
Python数据库操作:SQLAlchemy ORM指南
jvm·数据库·python
sqyno1sky14 分钟前
高级爬虫技巧:处理JavaScript渲染(Selenium)
jvm·数据库·python