MySQL的索引使用B+树结构。
1、B树
在说B+树之前,先说说B树,B树是一个多路平衡查找树,相较于普通的二叉树,不会发生极度不平衡的状况,同时也是多路的。
B树的特点是:他会将数据也保存在非叶子节点。而这个特点会导致非页子节点不能存储大量的索引。如下图所示:
2、B+树
针对B树的特点,B+树做了优化。如下图所示:
我们看到,B+树将所有的data数据都保存到了叶子节点中,非叶子节点只保存索引和指针。
我们假设一个非叶子节点是16kb,每个索引,即主键是bigint,即8b,指针为8b。那么每页能存储大约1000个索引(16kb/ (8b + 8b))。而一颗3层B+树能够存储多少索引呢?如下图:
大约能够存储10亿个索引。通常B+树的高度在2-4层,由于MySql在运行时,根节点是常驻内存的,因此每次查找只需要大约2-3次IO。可以说,B+树的设计,就是根据机械磁盘的特性来进行设计的。
综上:
1、MySql 的主键不应该太大,如果使用 UUID 这种,将会浪费 B+ 树的非叶子节点。
2、MySql 的主键最好是自增的,如果使用 UUID 这种,每次插入都会调整 B+树,从而导致页分裂,严重影响性能。
3、如果项目中使用了分库分表,我们通常都会需要一个主键进行 sharding,那怎么办呢?在实现上,我们可以保留自增主键,而逻辑主键用来作为唯一索引即可。