面试高频：MySQL索引

1 概念

索引是一种特殊的文件，包含着对数据表里所有记录的引用指针。可以对表中的一列或多列创建索引，并指定索引的类型，各类索引有各自的数据结构实现。（具体细节在后续的数据库原理课程讲解）

2 作用

数据库中的表、数据、索引之间的关系，类似于书架上的图书、书籍内容和书籍目录的关系。

索引所起的作用类似书籍目录，可用于快速定位、检索数据。

索引对于提高数据库的性能有很大的帮助。

3 使用场景

要考虑对数据库表的某列或某几列创建索引，需要考虑以下几点：

数据量较大，且经常对这些列进行条件查询。
该数据库表的插入操作，及对这些列的修改操作频率较低。
索引会占用额外的磁盘空间。

满足以上条件时，考虑对表中的这些字段创建索引，以提高查询效率。

反之，如果非条件查询列，或经常做插入、修改操作，或磁盘空间不足时，不考虑创建索引。

4 使用

创建主键约束（PRIMARY KEY）、唯一约束（UNIQUE）、外键约束（FOREIGN KEY）时，会自动创建对应列的索引。

查看索引

show index from 表名;

案例：查看学生表已有的索引

showindex from student;

PRIMARY 是主键自动生成的索引（不需要手动输入，只要建表的时候，指定了主键，就会自动生成主键索引）

创建索引

对于非主键、非唯一约束、非外键的字段，可以创建普通索引

create index 索引名 on 表名(字段名);

案例：创建班级表中，name字段的索引

create index idx_classes_name on classes(name);

温馨提示：

创建索引,也是一个"危险操作"

如果是针对空表,或者表中的数据比较少(几千,几万 .... )创建索引,就谈不上危险不危险.

一旦表的数据量比较大,千万级别 ..... 此时创建索引操作,就可能会触发大量的硬盘IO,直接把机器就搞的卡死住了 .....

在最初建表的时候,都要有哪些索引,提前规划好,创建好 .....

万一某个表,确实没有提前创建索引,现在又有了很多数据了,非加索引不可,此时咋办呢 ??

删除索引

drop index 索引名 on 表名;

案例：删除班级表中name字段的索引

drop index idx_classes_name on classes;

只能删除,咱们自己创建的索引.不能删除自动生成的

删除索引,也是危险操作 !!!要能够慎重对待 ~~

5.数据库索引

二叉搜索树和哈希表,都不适合给数据库做索引.

1)二叉搜索树

最大的问题在于"二叉"当要保存的元素多的时候,就会使整个树的高度变的比较高~

一旦高度高了,比较次数就会变多 ~~硬盘上 ~~

2)哈希表

最大的问题在于,只能进行"相等"查询.无法进行><这样的"范围查询",也无法进行like

模糊查询.

3）B+树

为数据库量身定做的数据结构 ~~

这里主要的目的,不是为了减少比较的次数,而是要减少硬盘IO的次数.

非叶子节点，只需要存储key值，不需要存储数据行，消耗空间不大

1）不同于B树.

B树是有N个key,划分成N+1个区间

B+树是有N个key,划分出N个区间~

2）父节点中的key的值,会在下面的子节点中再次出现 ~~ (以子节点中的最大值的身份)

重复出现的做法,看起来好像是浪费空间

实际上非常有用 ~~

快速查找：重复键可以帮助加速查找操作。由于父节点中的键是子节点中键的最大值，能够有效地引导搜索路径。

范围查询：在进行范围查询时，父节点的键可以帮助快速定位到包含范围的子节点，从而加速范围查询的过程。

一致性：这种做法有助于保持树的平衡和一致性，使得所有节点都能保持相同的结构，简化插入和删除操作。

虽然这种重复看起来像是浪费空间，但实际上它为高效的查找和查询操作提供了很大的帮助。

3）B+树把叶子结点,像链表一样首尾相连了 ~~

此时,进行"范围查询"就会非常方便 !!!

B+树的优势

1.N叉搜索树,高度比较低,此时硬盘IO次数就比较少.

2.叶子结点是全集,并且用链表结构连接,非常便于范围查询 ~~

3.B+树,所有的查询都是要落到叶子结点上完成的 ~~ 任何一次查询,经历的IO次数和比较次数都是差不多的,查询的开销稳定的 ~~

4.由于B+树,叶子结点是全集,非叶子节点上不必存储"数据行",只需要存储索引列的key即可 .

使得非叶子节点,消耗的空间比较少 ~~

6.面试模拟

谈谈对于数据库索引的理解 ~~

如果能连续讲30分钟,基本上就稳了 !!!

最关键的是,能否有某个点,打动面试官 ~~

1)索引是啥,解决啥问题的~

索引相当于书的目录,能够提高查询的速度

2)索引付出了什么代价

a)需要更多的存储空间

b)可能会影响增删改的效率(不是一定会影响)

整体来说,索引利大于弊,日常开发还是会经常使用的.

3)如何使用sql 操作索引,是否有注意事项

a) show index from表名;查看索引 (主键,外键,unique,会自动生成索引)

b) create index 索引名 on表名(列名)

c)drop index 索引名 on表名;

4)索引背后的数据结构=>B+树特点和优势 .-

特点:

a)N叉搜索树,每个节点上包含N个key,划分出N个区间.

b)每个父节点中的元素,都会下沉到子节点中,作为该子节点中最大值的角色来存在.

c)叶子结点这一层就构成了数据集合的全集 ~~

d)使用类似于链表这样的结构,把叶子结点串起来.

优势

a)N叉搜索树,高度比较低,降低了硬盘IO次数

b)范围查询非常方便&高效

c)所有的查询都落到叶子结点上,开销非常稳定.容易预估成本.

d)叶子结点存储数据行,非叶子节点只存储索引列的key值,非叶子节点占据空间小,可以加载到内存中

进一步的减少查询时IO的访问次数.

如果您觉得有失偏颇请您在评论区指正，如果您觉得不错的话留个好评再走吧！！
您的鼓励就是对我最大的支持! ！！