hive的sql优化思路-明白底层运行逻辑

一、首先要明白底层map、shuffle、reduce的顺序之中服务器hdfs数据文件在内存与存储之中是怎么演变的,因为hive的性能瓶颈基本在内存,具体参考以下他人优秀文章:

1.Hive SQL底层执行过程详细剖析

2.Hive JOIN性能调优

二是要明白hive对应的sql它底层的map reduce的过程中sql字段的执行顺序,来理解map的key、value会填充什么值,才能深刻理解怎么一步一步的减少数据,避免内存占用太多。如mysql的执行顺序(from ->on ->join ->where ->group by ->having ->select ->distinct ->order by ->limit),hive则不是,具体参考以下他人优秀文章:

1.hive中join下on和where 执行顺序

相关推荐
yumgpkpm28 分钟前
华为HUAWEI昇腾910B下千问Qwen3.6-27B在的推理加速实践
sql·华为·langchain·json·ai编程·ai写作·gpu算力
ZC跨境爬虫1 小时前
SQL学习日志_Day2_深入SQL语法与数据库层级结构
数据库·sql·学习·oracle
码不停蹄的玄黓1 小时前
MySQL唯一索引能否做主键索引
数据库·sql·mysql
段一凡-华北理工大学2 小时前
工业领域的Hadoop架构学习~系列文章09:HBase列式数据库
数据库·人工智能·hadoop·架构·hbase·高炉炼铁·高炉炼铁智能化
muddjsv2 小时前
Hadoop 与 HBase 深度剖析:从架构原理到实战应用
hadoop·架构·hbase
小旭95272 小时前
MySQL 主从复制、MyCat 读写分离与分库分表实战
java·数据库·sql·mysql·database
ZC跨境爬虫2 小时前
SQL学习日志 Day_1:初识SQL,开启数据之旅
数据库·sql·学习
zxfBdd2 小时前
doris insert into和with as 合用
数据库·sql
wanghowie2 小时前
25. v2 实战:接入 Doris + SQL 三阶段(Planner / Optimizer / Execution)
数据库·sql
逍遥德2 小时前
PostgreSQL ---【序列】用法详解
数据库·后端·sql·postgresql