mysql索引

索引是什么？是帮助MySQL高效获取数据的数据结构

数据库中的表，在我们看起来是一行紧挨着一行的，但是在硬盘中，都是以链表的形式存储的，不适用索引，我们一行一行的查找数据，每一行从硬盘从读取到内存中，比对是否是我们想要的。磁盘IO性能是比较慢的。我们利用索引高效的获取数据。索引一般也比较大，也是放在硬盘上的。但是可以减少IO的次数。

为什么选择B+树？不用xx树？

这里所讲的树，默认都是对于任何一个节点，左节点小于根节点，右节点大于根节点，方便搜索

为什么不用平衡二叉树？

它是一棵空树或它的左右两个子树的高度差的绝对值不超过1，并且左右两个子树都是一棵平衡二叉树。解决了二叉查找树退化成链表的问题，

把插入，查找，删除的时间复杂度最好情况和最坏情况都维持在O(logN)。但是插入和删除时节点时，频繁的旋转操作会浪费很多时间。实现起来比较麻烦，而且需要旋转的次数不能预知。

有了上面的几个性质作为限制，即可避免二叉查找树退化成单链表的情况。但是，仅仅避免这种情况还不够，这里还要考虑某个节点到其每个叶子节点路径长度 的问题。如果某些路径长度过长，那么，在对这些路径上的节点进行增删查操作时，效率也会大大降低。这个时候性质4和性质5用途就凸显了，有了这两个性质作为约束，即可保证任意节点到其每个叶子节点路径最长不会超过最短路径的2倍。原因如下：

当某条路径最短时，这条路径必然都是由黑色节点构成。当某条路径长度最长时，这条路径必然是由红色和黑色节点相间构成(性质4限定了不能出现两个连续的红色节点)。而性质5又限定了从任一节点到其每个叶子节点的所有路径必须包含相同数量的黑色节点。

这些约束强制了红黑树的关键性质: 从根到叶子的最长的可能路径不多于最短的可能路径的两倍长。结果是这个树大致上是平衡的。因为操作比如插入、删除和查找某个值的最坏情况时间都要求与树的高度成比例，这个在高度上的理论上限允许红黑树在最坏情况下都是高效的。

红黑树和平衡二叉树的区别：

1、红黑树放弃了追求完全平衡， 追求大致平衡 ，在与平衡二叉树的时间复杂度相差不大的情况下，保证每次插入最多只需要三次旋转就能达到平衡，实现起来也更为简单。 由于它的设计，任何不平衡都会在三次旋转之内解决
2、平衡二叉树追求绝对平衡，条件比较苛刻，实现起来比较麻烦， 每次插入新节点之后需要旋转的次数不能预知。

然而，红黑树毕竟还是二叉树，一个结点最多拥有两个直接子结点，当我们有大量数据的时候，树的高度还是过高，磁盘IO的次数还是很高。一次磁盘IO的操作是很耗时的。