MySQL为什么不建议使用多表JOIN

一、典型回答

之所以不建议使用JOIN查询，最主要的原因就是JOIN的效率比较低。

MySQL是使用了嵌套循环（Nested-Loop Join）的方式实现关联查询的，简单点说就是要通过两层循环，用第一张表做外循环，第二张表做内循环，外循环的每条记录跟内循环中的记录作比较，符合条件的就输出。

而具体到算法实现上主要是simpl nested loop，block nested loop和index nested loop这三种。而且这三种的效率都没有特别高的。

MySQL使用了嵌套循环（Nested-Loop Join）的方式来实现关联查询的，如果有2张表JOIN的话，复杂度最高是O(n^2)，3张表则是O(n^3)...随着表越多，表中的数据量越多，JOIN的效率会呈指数级下降。

在MySQL中，可以使用JOIN在两个或多个表中进行联合查询，JOIN有三种，分别是INNER JOIN、LEFT JOIN、RIGHT JOIN。

INNER JOIN（内连接或等值连接）：获取两个表中字段匹配关系的记录，取两个表的交集部分。

LEFT JOIN（左连接）：获取左表左右记录，即使右表没有对应匹配的记录，取两个表的交集部分+左表中的数据。

RIGHT JOIN（右连接）：与LEFT JOIN相反，用户获取右表所有记录，即使左表没有对应匹配的记录，取两个表的交集部分+右表中的数据。

MySQL使用了嵌套循环（Nested-Loop Join）的方法来实现关联查询的，simpl nested loop，block nested loop和index nested loop三种。

simpl nested loop：他的做法简单粗暴，就是全量扫描连接两张表进行数据的两两对比，所以他的复杂度可以认为是N*M（N是驱动表的数量，M是被驱动表的数量）。

block nested loop：当inner loop的表用到字段来索引的话，可以用到索引进行查询数据，因为索引是B+树的，复杂度可以近似认为是N*logM。

index nested loop：引入了BUFFER，会提前把外循环的一部分结果放到JOIN BUFFER中然后内循环的每一行都和整体BUFFER的数据作比较，索然比较次数还是N*M，但是因为JOIN BUFFER是基于内存的，所以效率高很多。

所以，虽然MySQL已经尽可能的在优化了，但是这几种算法复杂度还是挺高的，这也是说为什么不建议在数据库中多表JOIN的原因，随着表越多，表中的数据量越多，JOIN的效率会呈指数级下降。

如果不能通过数据库在关联查询，那么需要查询多表数据的时候要怎么做呢？

主要有两种方法：

1、在内存中自己做关联，即先从数据库中把数据查出来之后，在代码中进行二次查询，然后再进行关联。

2、数据冗余，那就把一些重要的数据在表中做冗余，这样就可以避免关联查询了。

3、宽表，就是基于一定的JOIN关系，把数据库中多张表的数据打平做一张大宽表，可以同步到ES或者干脆直接在数据库中直接查出来。

参考：Hollis