hive的sql优化思路-明白底层运行逻辑

一、首先要明白底层map、shuffle、reduce的顺序之中服务器hdfs数据文件在内存与存储之中是怎么演变的,因为hive的性能瓶颈基本在内存,具体参考以下他人优秀文章:

1.Hive SQL底层执行过程详细剖析

2.Hive JOIN性能调优

二是要明白hive对应的sql它底层的map reduce的过程中sql字段的执行顺序,来理解map的key、value会填充什么值,才能深刻理解怎么一步一步的减少数据,避免内存占用太多。如mysql的执行顺序(from ->on ->join ->where ->group by ->having ->select ->distinct ->order by ->limit),hive则不是,具体参考以下他人优秀文章:

1.hive中join下on和where 执行顺序

相关推荐
撰卢8 小时前
Filter快速入门 Java web
java·前端·hive·spring boot
张帅涛_6669 小时前
Golang中GROM多表关联跟原生SQL多表关联区别
开发语言·sql·golang
大大大水蜜桃9 小时前
sql练习二
java·数据库·sql
哪里不会点哪里.10 小时前
EXPLAIN:你的SQL性能优化透视镜
sql·oracle·性能优化
BD_Marathon11 小时前
Servlet快速入门
hive·hadoop·servlet
码字的字节11 小时前
Hadoop小文件合并技术深度解析:HAR文件归档、存储代价与索引结构
大数据·hadoop·分布式·har·小文件合并
kp0000012 小时前
【web安全】SQL注入与认证绕过
sql·安全·web安全
hie9889415 小时前
springboot注册servlet
hive·spring boot·servlet
木木子999920 小时前
SQL189 牛客直播各科目同时在线人数
sql