深入理解MySQL_8 Index 索引(上)

原创作者:田超凡

1 数据结构

一方面mysql的数据是存储在磁盘上的,另一方面还要满足对日常操作如【增删改查】的高效稳定的支持,我们当然可以采用更好的硬件来提升性能,但是选用合适的数据结构也很关键,innodb采用的是一种名为【b+树】的数据结构。

innodb中的数据是以【行】为单位,存在一个个大小为16k的【页】中,b+树的作用就是按照一个的组织形式,将所有的【页】组织关联起来。

1.1 B-树

这里的 B 表示 balance( 平衡的意思),B-树是一种【多路自平衡的搜索树】,它类似普通的平衡二叉树,不同的一点是B-树允许每个节点有更多的子节点。

B-树有如下特点:

(1)所有键值分布在整颗树中;

(2)任何一个关键字出现且只出现在一个结点中;

(3)搜索有可能在非叶子结点结束;

(4)在关键字全集内做一次查找,性能逼近二分查找;

1.2 B+树

【B+树】是【B-树】的变体,也是一种多路搜索树, 它与 B- 树的不同之处在于:

(1)所有关键字存储在叶子节点

(2)为所有叶子结点增加了一个双向指针

1.3 选型缘由

问题一:为什么在b-树或b+树中选择?

  • mysql数据模型更适合用这类数据结构,一条数据中通常包含【id】+【其他列数据】,我们可以很轻松的根据id组织一颗B+树。
  • 我们知道innodb使用【页】(这是inndb管理数据的最小单位)保存数据,一页(16k),b+树中的每个节点都是一页数据。

问题二:为什么选择B+树?

  • 相同的空间,不存放【整行数据】就能存【更多的id】,b+树能使每个节点能检索的【范围更大、更精确,极大的减少了I/O操作,保证b+树的层高较低,通常3到4层的层高就能支持百万级别的访问】。
  • Mysql是一种关系型数据库,【区间访问】是很常见的一种情况,B+树叶节点增加的双向指针,加强了区间访问性,可使用在范围区间查询的情况。

1.4 发现索引

当使用id去查询数据时,效率很高,因为使用id可以利用B+树的特性,加速查询。

查询相同的记录,使用【id列】比使用【emil列】快了389倍,原因如下:

(1)使用id列可以利用B+树的特性,由上自下查询。

(2)使用email列只能从叶子节点进行【全表扫描】,一个一个的比较。

相关推荐
唐青枫13 小时前
MySQL JSON 实战详解:从存储、查询、更新到 JSON_TABLE 与索引
sql·mysql
小满87814 小时前
5.Mysql事务隔离级别与锁机制
mysql
元Y亨H1 天前
技术笔记:MySQL 字符集排序规则与大小写敏感性问题解决方案
mysql
这个DBA有点耶2 天前
GROUP BY优化全解:如何写出既不丢数据又飞快的分组查询
数据库·mysql·架构
掉头发的王富贵2 天前
【StarRocks】极限十分钟入门StarRocks
数据库·sql·mysql
SamDeepThinking3 天前
一条UPDATE语句在MySQL 8.0中到底加了几把锁?
后端·mysql·程序员
李白客4 天前
KES新版MySQL兼容能力再升级意味着什么?
mysql·国产数据库
Jim6006 天前
【吃透 MySQL InnoDB连载】第 1 章・解密线上数据库高频故障
mysql
GreatSQL7 天前
gt-checksum v4.0.0 新功能解读系列文章(4):SSL 加密连接——数据校验传输安全再升级
mysql