MySQL为什么不建议使用多表JOIN

一、典型回答

之所以不建议使用JOIN查询,最主要的原因就是JOIN的效率比较低。

MySQL是使用了嵌套循环(Nested-Loop Join)的方式实现关联查询的,简单点说就是要通过两层循环,用第一张表做外循环,第二张表做内循环,外循环的每条记录跟内循环中的记录作比较,符合条件的就输出。

而具体到算法实现上主要是simpl nested loop,block nested loop和index nested loop这三种。而且这三种的效率都没有特别高的。

MySQL使用了嵌套循环(Nested-Loop Join)的方式来实现关联查询的,如果有2张表JOIN的话,复杂度最高是O(n^2),3张表则是O(n^3)...随着表越多,表中的数据量越多,JOIN的效率会呈指数级下降。

二、JOIN

在MySQL中,可以使用JOIN在两个或多个表中进行联合查询,JOIN有三种,分别是INNER JOIN、LEFT JOIN、RIGHT JOIN。

INNER JOIN(内连接或等值连接):获取两个表中字段匹配关系的记录,取两个表的交集部分。

LEFT JOIN(左连接):获取左表左右记录,即使右表没有对应匹配的记录,取两个表的交集部分+左表中的数据。

RIGHT JOIN(右连接):与LEFT JOIN相反,用户获取右表所有记录,即使左表没有对应匹配的记录,取两个表的交集部分+右表中的数据。

三、嵌套循环算法

MySQL使用了嵌套循环(Nested-Loop Join)的方法来实现关联查询的,simpl nested loop,block nested loop和index nested loop三种。

simpl nested loop:他的做法简单粗暴,就是全量扫描连接两张表进行数据的两两对比,所以他的复杂度可以认为是N*M(N是驱动表的数量,M是被驱动表的数量)。

block nested loop:当inner loop的表用到字段来索引的话,可以用到索引进行查询数据,因为索引是B+树的,复杂度可以近似认为是N*logM。

index nested loop:引入了BUFFER,会提前把外循环的一部分结果放到JOIN BUFFER中然后内循环的每一行都和整体BUFFER的数据作比较,索然比较次数还是N*M,但是因为JOIN BUFFER是基于内存的,所以效率高很多。

所以,虽然MySQL已经尽可能的在优化了,但是这几种算法复杂度还是挺高的,这也是说为什么不建议在数据库中多表JOIN的原因,随着表越多,表中的数据量越多,JOIN的效率会呈指数级下降。

四、不能用JOIN如何做关联查询

如果不能通过数据库在关联查询,那么需要查询多表数据的时候要怎么做呢?

主要有两种方法:

1、在内存中自己做关联,即先从数据库中把数据查出来之后,在代码中进行二次查询,然后再进行关联。

2、数据冗余,那就把一些重要的数据在表中做冗余,这样就可以避免关联查询了。

3、宽表,就是基于一定的JOIN关系,把数据库中多张表的数据打平做一张大宽表,可以同步到ES或者干脆直接在数据库中直接查出来。

参考:Hollis

相关推荐
黄俊懿4 小时前
复合索引设计指南:最左前缀 & 字段排座次
数据库·sql·mysql·adb·性能优化·dba·db
桃花键神5 小时前
【2026精品项目】基于SpringBoot3+Vue3的旧物置换系统(包含源码+项目文档+SQL脚本+部署教程)
数据库·spring boot·sql·vue
Fan_-_5 小时前
MySQL / PostgreSQL DDL 审核自动化:从人工 review 到 CI 拦截
mysql·postgresql·自动化
.柒宇.5 小时前
Redis高频面试题与跳跃表原理详解
数据库·redis·缓存
Bryce学亮5 小时前
股票数据成本分析工具
数据库
思麟呀5 小时前
MySQL表的约束
数据库·mysql
步十人5 小时前
【FastAPI】ORM-02.使用 ORM 高效处理数据库逻辑
服务器·数据库·fastapi
Apache IoTDB6 小时前
时序数据库 IoTDB + 时序智能服务平台 TimechoAI 亮相中国核电信息技术高峰论坛
数据库·时序数据库·iotdb
未若君雅裁6 小时前
Redis 和 MySQL 双写一致性:延迟双删、读写锁、MQ、Canal 怎么选?
数据库·redis·面试
罗超驿6 小时前
9.深度剖析MySQL约束的工程设计:自增主键的分布式局限、外键约束的权衡,与CHECK的版本适配实践
数据库·mysql