MySQL 8.0——索引

索引

1、索引简介

索引是对数据库表中一列或多列的值进行排序的一种结构,使用索引可提高数据库中特定数据的查询速度。

1.1、索引的含义和特点

索引是一个单独的、存储在磁盘上的数据库结构,包含着对数据表里所有记录的引用指针。使用索引可以快速找出在某个或多个列中有一特定值的行,所有MySQL列类型都可以被索引,对相关列使用索引是提高查询操作速度的最佳途径。

例如,数据库中有2万条记录,现在要执行一个查询"SELECT * FROM table wherenum=10000"​,如果没有索引,就必须遍历整个表,直到num等于10000的这一行被找到为止;如果在num列上创建索引,MySQL不需要任何扫描,直接在索引里面找10000,就可以得知这一行的位置。可见,索引的建立可以提高数据库的查询速度。

索引是在存储引擎中实现的,因此,每种存储引擎的索引都不一定完全相同,并且每种存储引擎也不一定支持所有索引类型。根据 存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引,总索引长度至少为256字节。大多数存储引擎有更高的限制。MySQL中索引的存储类型有两种,即BTREE和HASH,具体和表的存储引擎相关;MyISAM和InnoDB存储引擎只支持BTREE索引;MEMORY/HEAP存储引擎可以支持HASH和BTREE索引。

索引的优点主要有以下几条:

  1. 通过创建唯一索引,可以保证数据库表中每一行数据的唯一性。
  2. 可以大大加快数据的查询速度,这也是创建索引的主要原因。
  3. 在实现数据的参考完整性方面,可以加速表和表之间的连接。
  4. 在使用分组和排序子句进行数据查询时,也可以显著减少查询中分组和排序的时间。

增加索引也有许多不利的方面,主要表现在如下几个方面:

  • 创建索引和维护索引要耗费时间,并且随着数据量的增加所耗费的时间也会增加。
  • 索引需要占磁盘空间,除了数据表占数据空间之外,每一个索引还要占一定的物理空间,如果有大量的索引,索引文件可能比数据文件更快达到最大文件尺寸。
  • 当对表中的数据进行增加、删除和修改的时候,索引也要动态地维护,这样就降低了数据的维护速度。

1.2、索引的分类

1. 普通索引和唯一索引

  • 普通索引是MySQL中的基本索引类型,允许在定义索引的列中插入重复值和空值。
  • 唯一索引要求索引列的值必须唯一,但允许有空值。如果是组合索引,则列值的组合必须唯一。主键索引是一种特殊的唯一索引,不允许有空值。

2. 单列索引和组合索引

  • 单列索引即一个索引只包含单个列,一个表可以有多个单列索引。
  • 组合索引是指在表的多个字段组合上创建的索引,只有在查询条件中使用了这些字段的左边字段时,索引才会被使用。使用组合索引时遵循最左前缀集合。

3. 全文索引

  • 全文索引类型为FULLTEXT,在定义索引的列上支持值的全文查找,允许在这些索引列中插入重复值和空值。全文索引可以在CHAR、VARCHAR或者TEXT类型的列上创建。MySQL中只有MyISAM存储引擎支持全文索引。

4. 空间索引

  • 空间索引是对空间数据类型的字段建立的索引,MySQL中的空间数据类型有4种,分别是GEOMETRY、POINT、LINESTRING和POLYGON。MySQL使用SPATIAL关键字进行扩展,使得能够用创建正规索引类似的语法创建空间索引。创建空间索引的列,必须将其声明为NOT NULL,空间索引只能在存储引擎为MyISAM的表中创建。

1.3、索引的设计原则

索引设计不合理或者缺少索引都会对数据库和应用程序的性能造成障碍。高效的索引对于获得良好的性能非常重要。设计索引时,应该考虑以下准则:

  1. 索引并非越多越好,一个表中如有大量的索引,不仅占用磁盘空间,还会影响INSERT、DELETE、UPDATE等语句的性能,因为在表中的数据更改时,索引也会进行调整和更新。
  2. 避免对经常更新的表进行过多的索引,并且索引中的列要尽可能少。应该经常用于查询的字段创建索引,但要避免添加不必要的字段。
  3. 数据量小的表最好不要使用索引,由于数据较少,查询花费的时间可能比遍历索引的时间还要短,索引可能不会产生优化效果。
  4. 在条件表达式中经常用到的不同值较多的列上建立索引,在不同值很少的列上不要建立索引。比如在学生表的"性别"字段上只有"男"与"女"两个不同值,因此就无须建立索引,如果建立索引不但不会提高查询效率,反而会严重降低数据更新速度。
  5. 当唯一性是某种数据本身的特征时,指定唯一索引。使用唯一索引需能确保定义的列的数据完整性,以提高查询速度。
  6. 在频繁进行排序或分组(即进行groupby或order by操作)的列上建立索引,如果 待排序的列有多个,可以在这些列上建立组合索引。

2、创建索引

MySQL支持多种方法在单个或多个列上创建索引:

  • 在创建表的定义语句CREATE TABLE中指定索引列
  • 使用ALTER TABLE语句在存在的表上创建索引
  • 使用CREATE INDEX语句在已存在的表上添加索引

2.1、创建表的时候创建索引

使用CREATE TABLE创建表时,除了可以定义列的数据类型,还可以定义主键约束、外键约束或者唯一性约束,而不论创建哪种约 束,在定义约束的同时相当于在指定列上创建了一个索引。创建表时创建索引的基本语法格式如下:

sql 复制代码
create table table_name [col_name data_type]
[unique | fulltext | spatial] [index | key ] [index_name] (col_name [length]) [asc | desc]
  • UNIQUE、FULLTEXT和SPATIAL为可选参数,分别表示唯一索引、全文索引和空间索引;
  • INDEX与KEY为同义词,两者作用相同,用来指定创建索引;
  • col_name为需要创建索引的字段列,该列必须从数据表中定义的多个列中选择;
  • index_name指定索引的名称,为可选参数,如果不指定,MySQL默认col_name为索引值;
  • length为可选参数,表示索引的长度,只有字符串类型的字段才能指定索引长度;
  • ASC或DESC指定升序或者降序的索引值存储。
2.1.1、创建普通索引

最基本的索引类型,没有唯一性之类的限制,其作用只是加快对数据的访问速度。

在book表中的year_publication字段上建立普通索引,SQL语句如下:

sql 复制代码
create table book
(
	bookid int not null,
	bookname varchar(255) not null,
	authors varchar(255) not null,
	info varchar(255) null,
	comment varchar(255) null,
	year_publication year not null,
	index(year_publication)
);

该语句执行完毕之后,使用SHOW CREATETABLE查看表结构:

sql 复制代码
show create table book;

+-------+-----------------------------------------------+
| Table | Create Table                                  |
+-------+-----------------------------------------------+
| book  | CREATE TABLE `book` (                         |
|       |   `bookid` int NOT NULL,                      |
|       |   `bookname` varchar(255) NOT NULL,           |
|       |   `authors` varchar(255) NOT NULL,            |
|       |   `info` varchar(255) DEFAULT NULL,           |
|       |   `comment` varchar(255) DEFAULT NULL,        |
|       |   `year_publication` year NOT NULL,           |
|       |   KEY `year_publication` (`year_publication`) |
|       | ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb3       |
+-------+-----------------------------------------------+

由结果可以看到,book表的year_publication字段成功建立了索引,其索引名称year_publication为MySQL自动添加。使用EXPLAIN语句查看索引是否正在使用:

sql 复制代码
explain select * from book
where year_publication = 1990\G;

             -> ^Iinfo varchar(255) null,
***************************[ 1. row ]***************************
id            | 1
select_type   | SIMPLE
table         | book
partitions    | <null>
type          | ref
possible_keys | year_publication
key           | year_publication
key_len       | 1
ref           | const
rows          | 1
filtered      | 100.0
Extra         | <null>

EXPLAIN语句输出结果的各个行解释如下:

  1. select_type行指定所使用的SELECT查询类型,这里值为SIMPLE,表示简单的SELECT,不使用UNION或子查询。其他可能的取值有PRIMARY、UNION、SUBQUERY等。
  2. table行指定数据库读取的数据表的名字,它们按被读取的先后顺序排列。
  3. type行指定了本数据表与其他数据表之间的关联关系,可能的取值有system、const、eq_ref、ref、range、index和All。
  4. possible_keys行给出了MySQL在搜索数据记录时可选用的各个索引。
  5. key行是MySQL实际选用的索引。
  6. key_len行给出索引按字节计算的长度,key_len数值越小,表示越快。
  7. ref行给出了关联关系中另一个数据表里的数据列名。
  8. rows行是MySQL在执行这个查询时预计会从这个数据表里读出的数据行的个数。
  9. Extra行提供了与关联操作有关的信息。

可以看到,possible_keys和key的值都为year_publication,查询时使用了索引。

2.1.2、创建唯一索引

创建唯一索引的主要原因是减少查询索引列操作的执行时间,尤其是对比较庞大的数据表。它与前面的普通索引类似,不同的就是:索引列的值必须唯一,但允许有空值。如果是组合索引,则列值的组合必须唯一。

创建一个表t1,在表中的id字段上使用UNIQUE关键字创建唯一索引。

sql 复制代码
create table t1
(
	id int not null,
	name char(30) not null,
	unique index UniqIdx(id)
);

该语句执行完毕之后,使用SHOW CREATETABLE查看表结构:

sql 复制代码
show create table t1;

+-------+-----------------------------------------+
| Table | Create Table                            |
+-------+-----------------------------------------+
| t1    | CREATE TABLE `t1` (                     |
|       |   `id` int NOT NULL,                    |
|       |   `name` char(30) NOT NULL,             |
|       |   UNIQUE KEY `UniqIdx` (`id`)           |
|       | ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb3 |
+-------+-----------------------------------------+

由结果可以看到,id字段上已经成功建立了一个名为UniqIdx的唯一索引。

2.1.3、创建单列索引

单列索引是在数据表中的某一个字段上创建的索引,一个表中可以创建多个单列索引。前面两个例子中创建的索引都为单列索引。

创建一个表t2,在表中的name字段上创建单列索引。

sql 复制代码
create table t2
(
	id int not null,
	name char(50) null,
	index SingleIdx(name(20))
);

该语句执行完毕之后,使用SHOW CREATETABLE查看表结构:

sql 复制代码
show create table t2;

+-------+-----------------------------------------+
| Table | Create Table                            |
+-------+-----------------------------------------+
| t2    | CREATE TABLE `t2` (                     |
|       |   `id` int NOT NULL,                    |
|       |   `name` char(50) DEFAULT NULL,         |
|       |   KEY `SingleIdx` (`name`(20))          |
|       | ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb3 |
+-------+-----------------------------------------+

由结果可以看到,id字段上已经成功建立了一个名为SingleIdx的单列索引,索引长度为20。

2.1.4、创建组合索引

组合索引是在多个字段上创建一个索引。

创建表t3,在表中的id、name和age字段上建立组合索引,SQL语句如下:

sql 复制代码
create table t3
(
	id int(11) not null,
	name char(30) not null,
	age int(11) not null,
	info varchar(255),
	index MultiIdx(id, name, age)
);

该语句执行完毕之后,使用SHOW CREATETABLE查看表结构:

sql 复制代码
show create table t3;

+-------+-----------------------------------------+
| Table | Create Table                            |
+-------+-----------------------------------------+
| t3    | CREATE TABLE `t3` (                     |
|       |   `id` int NOT NULL,                    |
|       |   `name` char(30) NOT NULL,             |
|       |   `age` int NOT NULL,                   |
|       |   `info` varchar(255) DEFAULT NULL,     |
|       |   KEY `MultiIdx` (`id`,`name`,`age`)    |
|       | ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb3 |
+-------+-----------------------------------------+

由结果可以看到,id、name和age字段上已经成功建立了一个名为MultiIdx的组合索引。

组合索引可起几个索引的作用,但是使用时并不是随便查询哪个字段都可以使用索引, 而是遵从"最左前缀"​:利用索引中最左边的列集来匹配行,这样的列集称为最左前缀。例如,这里由id、name和age 3个字段构成的索引,索引行中按id、name、age的顺序存放,索引可以搜索(id, name,age)​、​(id, name)或者id字段组合。如果列不构成索引最左面的前缀,那么MySQL不能使用局部索引,如(age)或者(name,age)组合则不能使用索引查询。

在t3表中,查询id和name字段,使用EXPLAIN语句查看索引的使用情况:

sql 复制代码
explain select * from t3
where id = 1 and name = 'joe' \G;

***************************[ 1. row ]***************************
id            | 1
select_type   | SIMPLE
table         | t3
partitions    | <null>
type          | ref
possible_keys | MultiIdx
key           | MultiIdx
key_len       | 94
ref           | const,const
rows          | 1
filtered      | 100.0
Extra         | <null>

可以看到,查询id和name字段时,使用了名称MultiIdx的索引,如果查询(name,age)组合或者单独查询name和age字段,结果如下:

sql 复制代码
explain select * from t3
where name = 'joe' \G;

***************************[ 1. row ]***************************
id            | 1
select_type   | SIMPLE
table         | t3
partitions    | <null>
type          | ALL
possible_keys | <null>
key           | <null>
key_len       | <null>
ref           | <null>
rows          | 1
filtered      | 100.0
Extra         | Using where

此时,possible_keys和key值为NULL,并没有使用在t3表中创建的索引进行查询。

2.1.5、创建全文索引

FULLTEXT全文索引可以用于全文搜索。只有MyISAM存储引擎支持FULLTEXT索引,并且只为CHAR、VARCHAR和TEXT列创建索引。索引总是对整个列进行,不支持局部(前缀)索引。

创建表t4,在表中的info字段上建立全文索引,SQL语句如下:

sql 复制代码
create table t4
(
	id int not null,
	name char(30) not null,
	age int not null,
	info varchar(255),
	fulltext index FullTxtIdx(info)
) engine = MyISAM;

因为MySQL 8.0中默认存储引擎为InnoDB,在这里创建表时需要修改表的存储引擎为MyISAM,不然创建索引会出错。

语句执行完毕之后,使用SHOW CREATETABLE查看表结构:

sql 复制代码
show create table t4;

+-------+-----------------------------------------+
| Table | Create Table                            |
+-------+-----------------------------------------+
| t4    | CREATE TABLE `t4` (                     |
|       |   `id` int NOT NULL,                    |
|       |   `name` char(30) NOT NULL,             |
|       |   `age` int NOT NULL,                   |
|       |   `info` varchar(255) DEFAULT NULL,     |
|       |   FULLTEXT KEY `FullTxtIdx` (`info`)    |
|       | ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb3 |
+-------+-----------------------------------------+

由结果可以看到,info字段上已经成功建立了一个名为FullTxtIdx的FULLTEXT索引。全文索引非常适合于大型数据集,对于小的数据集,它的用处比较小。

2.1.6、创建空间索引

空间索引必须在MyISAM类型的表中创建,且空间类型的字段必须为非空。

创建表t5,在空间类型为GEOMETRY的字段上创建空间索引,SQL语句如下:

sql 复制代码
create table t5
(
	g geometry not null,
	spatial index spatIdx(g)
)engine=MyISAM;

该语句执行完毕之后,使用SHOW CREATETABLE查看表结构:

sql 复制代码
show create table t5;

+-------+-----------------------------------------+
| Table | Create Table                            |
+-------+-----------------------------------------+
| t5    | CREATE TABLE `t5` (                     |
|       |   `g` geometry NOT NULL,                |
|       |   SPATIAL KEY `spatIdx` (`g`)           |
|       | ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb3 |
+-------+-----------------------------------------+

可以看到,t5表的g字段上创建了名称为spatIdx的空间索引。注意创建时指定空间类型字段值的非空约束,并且表的存储引擎为MyISAM。

2.2、在已经存在的表上创建索引

在已经存在的表中创建索引,可以使用ALTER TABLE语句或者CREATE INDEX语句,本节将介绍如何使用ALTER TABLE和CREATE INDEX语句在已知表字段上创建索引。

2.2.1、使用ALTER TABLE语句创建索引

ALTER TABLE创建索引的基本语法如下:

sql 复制代码
alter table table_name add [unique | fulltext | spatial] [index | key] 
	[index_name] (col_name[length],...) [asc | desc]

与创建表时创建索引的语法不同的是,在这里使用了ALTER TABLE和ADD关键字,ADD表示向表中添加索引。

在book表中的bookname字段上建立名为BkNameIdx的普通索引。

添加索引之前,使用SHOW INDEX语句查看指定表中创建的索引:

sql 复制代码
show index from book \G;

***************************[ 1. row ]***************************
Table         | book
Non_unique    | 1
Key_name      | year_publication
Seq_in_index  | 1
Column_name   | year_publication
Collation     | A
Cardinality   | 0
Sub_part      | <null>
Packed        | <null>
Null          |
Index_type    | BTREE
Comment       |
Index_comment |
Visible       | YES
Expression    | <null>

其中各个主要参数的含义为:

  • Table表示创建索引的表。
  • Non_unique表示索引非唯一,1代表是非唯一索引,0代表唯一索引。
  • Key_name表示索引的名称。
  • Seq_in_index表示该字段在索引中的位置,单列索引该值为1,组合索引为每个字段在索引定义中的顺序。
  • Column_name表示定义索引的列字段。
  • Sub_part表示索引的长度。
  • Null表示该字段是否能为空值。
  • Index_type表示索引类型。

可以看到,book表中已经存在了一个索引,即前面已经定义的名称为year_publication索引,该索引为非唯一索引。

下面使用ALTER TABLE在bookname字段上添加索引,SQL语句如下:

sql 复制代码
alter table book add index BkNameIdx(bookname(30));

使用SHOW INDEX语句查看表中的索引:

sql 复制代码
show index from book \G;

***************************[ 1. row ]***************************
Table         | book
Non_unique    | 1
Key_name      | year_publication
Seq_in_index  | 1
Column_name   | year_publication
Collation     | A
Cardinality   | 0
Sub_part      | <null>
Packed        | <null>
Null          |
Index_type    | BTREE
Comment       |
Index_comment |
Visible       | YES
Expression    | <null>
***************************[ 2. row ]***************************
Table         | book
Non_unique    | 1
Key_name      | BkNameIdx
Seq_in_index  | 1
Column_name   | bookname
Collation     | A
Cardinality   | 0
Sub_part      | 30
Packed        | <null>
Null          |
Index_type    | BTREE
Comment       |
Index_comment |
Visible       | YES
Expression    | <null>

可以看到,现在表中已经有了两个索引,另一个为通过ALTER TABLE语句添加的名称为BkNameIdx的索引,该索引为非唯一索引,长度为30。

在book表的bookId字段上建立名称为UniqidIdx的唯一索引,SQL语句如下:

sql 复制代码
alter table book add unique index UniqidIdx(bookId);

使用SHOW INDEX语句查看表中的索引:

sql 复制代码
show index from book \G;

***************************[ 1. row ]***************************
Table         | book
Non_unique    | 0
Key_name      | UniqidIdx
Seq_in_index  | 1
Column_name   | bookid
Collation     | A
Cardinality   | 0
Sub_part      | <null>
Packed        | <null>
Null          |
Index_type    | BTREE
Comment       |
Index_comment |
Visible       | YES
Expression    | <null>

可以看到Non_unique属性值为0,表示名称为UniqidIdx的索引为唯一索引,创建唯一索引成功。

在book表的comment字段上建立单列索引,SQL语句如下:

sql 复制代码
alter table book add index BkcmtIdx(comment(50));

使用SHOW INDEX语句查看表中的索引:

sql 复制代码
show index from book \G;

***************************[ 3. row ]***************************
Table         | book
Non_unique    | 1
Key_name      | BkNameIdx
Seq_in_index  | 1
Column_name   | bookname
Collation     | A
Cardinality   | 0
Sub_part      | 30
Packed        | <null>
Null          |
Index_type    | BTREE
Comment       |
Index_comment |
Visible       | YES
Expression    | <null>

可以看到,语句执行之后在book表的comment字段上建立了名称为BkcmtIdx的索引,长度为50,在查询时,只需要检索前50个字符。

在book表的authors和info字段上建立组合索引,SQL语句如下:

sql 复制代码
alter table book add index BkAuAndInfoIdx (authors(30), info(50));

使用SHOW INDEX语句查看表中的索引:

sql 复制代码
show index from book \G;

***************************[ 5. row ]***************************
Table         | book
Non_unique    | 1
Key_name      | BkAuAndInfoIdx
Seq_in_index  | 1
Column_name   | authors
Collation     | A
Cardinality   | 0
Sub_part      | 30
Packed        | <null>
Null          |
Index_type    | BTREE
Comment       |
Index_comment |
Visible       | YES
Expression    | <null>
***************************[ 6. row ]***************************
Table         | book
Non_unique    | 1
Key_name      | BkAuAndInfoIdx
Seq_in_index  | 2
Column_name   | info
Collation     | A
Cardinality   | 0
Sub_part      | 50
Packed        | <null>
Null          | YES
Index_type    | BTREE
Comment       |
Index_comment |
Visible       | YES

可以看到名称为BkAuAndInfoIdx的索引由两个字段组成,authors字段长度为30,在组合索引中的序号为1,该字段不允许空值NULL;info字段长度为50,在组合索引中的序号为2,该字段可以为空值NULL。

创建表t6,在t6表上使用ALTER TABLE创建全文索引,SQL语句如下:

首先创建表t6,语句如下:

sql 复制代码
create table t6
(
	id int not null,
	info char(255)
)engine=MyISAM;

注意修改ENGINE参数为MyISAM,MySQL默认引擎InnoDB不支持全文索引。

使用ALTER TABLE语句在info字段上创建全文索引:

sql 复制代码
alter table t6 add fulltext index infoFTIdx(info);

使用SHOW INDEX语句查看索引:

sql 复制代码
show index from t6 \G;

***************************[ 1. row ]***************************
Table         | t6
Non_unique    | 1
Key_name      | infoFTIdx
Seq_in_index  | 1
Column_name   | info
Collation     | <null>
Cardinality   | 0
Sub_part      | <null>
Packed        | <null>
Null          | YES
Index_type    | FULLTEXT
Comment       |
Index_comment |
Visible       | YES
Expression    | <null>

可以看到,t6表中已经创建了名称为infoFTIdx的索引,该索引在info字段上创建,类型为FULLTEXT,允许空值。

创建表t7,在t7的空间数据类型字段g上创建名称为spatIdx的空间索引,SQL语句如下:

sql 复制代码
create table t7 
(
	g geometry not null
)engine=MyISAM;

使用ALTER TABLE在表t7的g字段建立空间索引:

sql 复制代码
alter table t7 add spatial index spatIdx(g);

使用SHOW INDEX语句查看索引:

sql 复制代码
show index from t7 \G;

***************************[ 1. row ]***************************
Table         | t7
Non_unique    | 1
Key_name      | spatIdx
Seq_in_index  | 1
Column_name   | g
Collation     | A
Cardinality   | 0
Sub_part      | 32
Packed        | <null>
Null          |
Index_type    | SPATIAL
Comment       |
Index_comment |
Visible       | YES
Expression    | <null>

可以看到,t7表的g字段上创建了名称为spatIdx的空间索引。

2.2.2、使用CREATE INDEX创建索引

CREATE INDEX语句可以在已经存在的表上添加索引。在MySQL中,CREATE INDEX被映射到一个ALTER TABLE语句上,基本语法结构为:

sql 复制代码
create [unique | fulltext | spatial] index index_name on table_name (col_name[length],...) [asc | desc]

可以看到CREATE INDEX语句和ALTERINDEX语句的语法基本一样,只是关键字不同。

在这里,使用相同的表book,假设该表中没有任何索引值,创建book表语句如下:

sql 复制代码
create table book
(
	bookid int not null,
	bookname varchar(255) not null,
	authors varchar(255) not null,
	info varchar(255) null,
	comment varchar(255) null,
	year_publication year not null
);

在book表中的bookname字段上建立名为BkNameIdx的普通索引,SQL语句如下:

sql 复制代码
create index BkNameIdx on book(bookname);

在book表的bookId字段上建立名称为UniqidIdx的唯一索引,SQL语句如下:

sql 复制代码
create unique index UniqidIdx on book(bookId);

语句执行完毕之后,将在book表中创建名称为UniqidIdx的唯一索引。

在book表的comment字段上建立单列索引,SQL语句如下:

sql 复制代码
create index BkcmtIdx on book(comment(50));

语句执行完毕之后,将在book表的comment字段上建立一个名为BkcmtIdx的单列索引,长度为50。

在book表的authors和info字段上建立组合索引,SQL语句如下:

sql 复制代码
create index BkAuAndInfoIdx on book(authors(20), info(50));

语句执行完毕之后,在book表的authors和info字段上建立了一个名为BkAuAndInfoIdx的组合索引,authors的索引序号为1、长度为20,info的索引序号为2、长度为50。

先删除表t6,再重新建立表t6,在t6表中使用CREATE INDEX语句,在CHAR类型的info字段上创建全文索引,SQL语句如下:

首先删除表t6,并重新建立该表,可以输入下面的语句:

sql 复制代码
drop table t6;

create table t6
(
	id int not null,
	info char(255)
) engine=MyISAM;

使用CREATE INDEX在t6表的info字段上创建名称为infoFTIdx的全文索引:

sql 复制代码
create fulltext index infoFTIdx on t6(info);

语句执行完毕之后,将在t6表中创建名称为infoFTIdx的索引,该索引在info字段上创建,类型为FULLTEXT,允许空值。

删除表t7,重新创建表t7,在t7表中使用CREATE INDEX语句,在空间数据类型字段g上创建名称为spatIdx的空间索引,SQL语句如下:

首先删除表t7,并重新建立该表,分别输入下面的语句:

sql 复制代码
drop table t7;

create table t7
(
	g geometry not null
)engine=MyISAM;

语句执行完毕之后,将在t7表中创建名称为spatIdx的空间索引,该索引在g字段上创建。

3、删除索引

MySQL中删除索引使用ALTER TABLE或者DROP INDEX语句,两者可实现相同的功能,DROP INDEX语句在内部被映射到一个ALTER TABLE语句中。

3.1、使用ALTER TABLE删除索引

ALTER TABLE删除索引的基本语法格式如下:

sql 复制代码
alter table table_name drop index  index_name;

删除book表中名称为UniqidIdx的唯一索引,SQL语句如下:

首先查看book表中是否有名称为UniqidIdx的索引,输入SHOW语句:

sql 复制代码
show create table book \G;

***************************[ 1. row ]***************************
Table        | book
Create Table | CREATE TABLE `book` (
  `bookid` int NOT NULL,
  `bookname` varchar(255) NOT NULL,
  `authors` varchar(255) NOT NULL,
  `info` varchar(255) DEFAULT NULL,
  `comment` varchar(255) DEFAULT NULL,
  `year_publication` year NOT NULL,
  UNIQUE KEY `UniqidIdx` (`bookid`),
  KEY `BkNameIdx` (`bookname`),
  KEY `BkcmtIdx` (`comment`(50)),
  KEY `BkAuAndInfoIdx` (`authors`(20),`info`(50))
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb3

查询结果可以看到,book表中有名称为UniqidIdx的唯一索引,该索引在bookid字段上创建。下面删除该索引,输入删除语句:

sql 复制代码
alter table book drop index UniqidIdx;

语句执行完毕,使用SHOW语句查看索引是否被删除:

sql 复制代码
show create table book \G;

***************************[ 1. row ]***************************
Table        | book
Create Table | CREATE TABLE `book` (
  `bookid` int NOT NULL,
  `bookname` varchar(255) NOT NULL,
  `authors` varchar(255) NOT NULL,
  `info` varchar(255) DEFAULT NULL,
  `comment` varchar(255) DEFAULT NULL,
  `year_publication` year NOT NULL,
  KEY `BkNameIdx` (`bookname`),
  KEY `BkcmtIdx` (`comment`(50)),
  KEY `BkAuAndInfoIdx` (`authors`(20),`info`(50))
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb3

由结果可以看到,book表中已经没有名称为uniqidIdx的唯一索引,删除索引成功。

添加AUTO_INCREMENT约束字段的唯一索引不能被删除。

3.2、使用DROP INDEX语句删除索引

DROP INDEX删除索引的基本语法格式如下:

sql 复制代码
drop index index_name on table_name;

删除book表中名称为BkAuAndInfoIdx的组合索引,SQL语句如下:

sql 复制代码
drop index BkAuAndInfoIdx on book;

语句执行完毕,使用SHOW语句查看索引是否被删除:

sql 复制代码
show create table book \G;

***************************[ 1. row ]***************************
Table        | book
Create Table | CREATE TABLE `book` (
  `bookid` int NOT NULL,
  `bookname` varchar(255) NOT NULL,
  `authors` varchar(255) NOT NULL,
  `info` varchar(255) DEFAULT NULL,
  `comment` varchar(255) DEFAULT NULL,
  `year_publication` year NOT NULL,
  KEY `BkNameIdx` (`bookname`),
  KEY `BkcmtIdx` (`comment`(50))
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb3

可以看到,book表中已经没有名称为BkAuAndInfoIdx的组合索引,删除索引成功。

删除表中的列时,如果要删除的列为索引的组成部分,则该列也会从索引中删除。如果组成索引的所有列都被删除,则整个索引将被删除。

4、MySQL 8.0的新特性------支持降序索引

在MySQL 8.0之前,MySQL在语法上已经支持降序索引,但实际上创建的仍然是升序索引。

下面通过案例来对比不同的版本中对降序索引的支持情况。

分别在MySQL 5.7版本和MySQL 8.0版本中创建数据表ts1,结果如下:

sql 复制代码
create table ts1
(
	a int,
	b int,
	index idx_a_b(a,b desc)
);

在MySQL 5.7版本中查看数据表ts1的结构,结果如下:

sql 复制代码
show create table ts1 \G;

*************************** 1. row ***************************
       Table: ts1
Create Table: CREATE TABLE `ts1` (
  `a` int(11) DEFAULT NULL,
  `b` int(11) DEFAULT NULL,
  KEY `idx_a_b` (`a`,`b`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1

从结果可以看出,索引仍然是默认的升序。

在MySQL 8.0版本中查看数据表ts1的结构,结果如下:

sql 复制代码
show create table ts1 \G;

***************************[ 1. row ]***************************
Table        | ts1
Create Table | CREATE TABLE `ts1` (
  `a` int DEFAULT NULL,
  `b` int DEFAULT NULL,
  KEY `idx_a_b` (`a`,`b` DESC)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb3

从结果可以看出,索引已经是降序了。下面继续测试降序索引在执行计划中的表现。

分别在MySQL 5.7版本和MySQL 8.0版本中的数据表ts1中插入8万条随机数据,执行语句如下:

sql 复制代码
delimiter ;;
create procedure ts_insert()
begin
	declare i int default 1;
	while i < 80000
	do
	insert into ts1 select rand() * 80000, rand() * 80000;
	set i = i + 1;
	end while;
	commit;
	end;;
delimiter ;

call ts_insert();

在MySQL 5.7版本中查看数据表ts1的执行计划,结果如下:

sql 复制代码
explain select * from ts1
order by a, b desc limit 5 \G;

*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: ts1
   partitions: NULL
         type: index
possible_keys: NULL
          key: idx_a_b
      key_len: 10
          ref: NULL
         rows: 80181
     filtered: 100.00
        Extra: Using index; Using filesort
1 row in set, 1 warning (0.01 sec)

从结果可以看出,执行计划中扫描数为80181,而且使用了Using filesort。

Using filesort是MySQL里一种速度比较慢的外部排序,如果能避免是最好的结果。多数情况下,管理员可以通过优化索引来尽量避免出现Using filesort,从而提高数据库执行速度。

在MySQL 8.0版本中查看数据表ts1的执行计划,结果如下:

sql 复制代码
explain select * from ts1
order by a, b desc limit 5 \G;

***************************[ 1. row ]***************************
id            | 1
select_type   | SIMPLE
table         | ts1
partitions    | <null>
type          | index
possible_keys | <null>
key           | idx_a_b
key_len       | 10
ref           | <null>
rows          | 5
filtered      | 100.0
Extra         | Using index

从结果可以看出,执行计划中扫描数为5,而且没有使用Using filesort。

降序索引只是对查询中特定的排序顺序有效,如果使用不当,反而查询效率更低。例如上述查询排序条件改为"order by a desc, b desc"​,MySQL 5.7的执行计划要明显好于MySQL 8.0。

将排序条件修改为"order by a desc, bdesc"后,下面来对比不同版本中执行计划的效果。

在MySQL 5.7版本中查看数据表ts1的执行计划,结果如下:

sql 复制代码
explain select * from ts1 
order by a desc, b desc 
limit 5 \G;

*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: ts1
   partitions: NULL
         type: index
possible_keys: NULL
          key: idx_a_b
      key_len: 10
          ref: NULL
         rows: 5
     filtered: 100.00
        Extra: Using index
1 row in set, 1 warning (0.00 sec)

在MySQL 8.0版本中查看数据表ts1的执行计划,结果如下:

sql 复制代码
explain select * from ts1 
order by a desc, b desc 
limit 5 \G;

***************************[ 1. row ]***************************
id            | 1
select_type   | SIMPLE
table         | ts1
partitions    | <null>
type          | index
possible_keys | <null>
key           | idx_a_b
key_len       | 10
ref           | <null>
rows          | 80181
filtered      | 100.0
Extra         | Using index; Using filesort

从结果可以看出,修改后MySQL 5.7的执行计划要明显好于MySQL 8.0。

5、MySQL 8.0的新特性------统计直方图

MySQL 8.0实现了统计直方图。利用直方图,用户可以对一张表的一列做数据分布的统计,特别是针对没有索引的字段。这可以帮助查询优化器找到更优的执行计划。

5.1、直方图的优点

在数据库中,查询优化器负责将SQL转换成最有效的执行计划。有时候,查询优化器会找不到最优的执行计划,导致花费了更多不必要的时间。造成这种情况的主要原因是,查询优化器有时无法准确地知道以下几个问题的答案:

  • 每个表有多少行?
  • 每一列有多少不同的值?
  • 每一列的数据分布情况如何?

例如,销售表production包括id、tm、count三个字段,分别表示编号、销售时间和销售数量。

对比以下两个查询语句:

sql 复制代码
  SELECT * FROM production WHERE tm BETWEEN "22:00:00" AND "23:59:00"
  SELECT * FROM production WHERE tm BETWEEN "08:00:00" AND "12:00:00"

如果销售时间大部分集中在上午8点到12点,在查询销售情况时,第一个查询语句耗费的时间会远远大于第二个查询语句。

因为没有统计数据,优化器会假设tm的值是均匀分配的。如何才能使查询优化器知道数据的分布情况呢?一个解决方法就是在列上建立统计直方图。

直方图能近似获得一列的数据分布情况,从而让数据库知道它含有哪些数据。直方图有多种形式,MySQL支持了两种:等宽直方图(singleton)和等高直方图(equi-height)​。直方图的共同点是,它们都将数据分到了一系列的buckets中去。MySQL会自动将数据划到不同的buckets中,也会自动决定创建哪种类型的直方图。

5.2、直方图的基本操作

创建直方图的语法格式如下:

sql 复制代码
analyze table table_name [update histogram on col_name with N buckets | drop histogram on col_name]

buckets的默认值是100。统计直方图的信息存储在数据字典表"column_statistcs"中,可以通过视图information_schema.COLUMN_STATISTICS访问。直方图以灵活的JSON格式存储。ANALYZE TABLE会基于表大小自动判断是否要进行取样操作。ANALYZE TABLE也会基于表中列的数据分布情况以及bucket的数量来决定是否要建立等宽直方图(singleton)还是等高直方图(equi-height)​。

创建用于测试的数据表production,语句如下:

sql 复制代码
create table production
(
	id int,
	tm time,
	count int
);

在数据表production的字段tm上创建直方图,执行语句如下:

sql 复制代码
analyze table production update histogram on tm with 60 buckets;

+--------------------+-----------+----------+-----------------------------------------------+
| Table              | Op        | Msg_type | Msg_text                                      |
+--------------------+-----------+----------+-----------------------------------------------+
| test_db.production | histogram | status   | Histogram statistics created for column 'tm'. |
+--------------------+-----------+----------+-----------------------------------------------+

buckets的值必须指定,可以设置为1到1024,默认值是100。设置buckets值时,可以先设置低一些,如果没有满足需求,可以再往上增大。

对于不同的数据集合,buckets的值取决于以下几个因素:

  • 这列有多少不同的值。
  • 数据的分布情况。
  • 需要多高的准确性。

在数据表production的字段tm和字段count上创建直方图,执行语句如下:

sql 复制代码
analyze table production update histogram on tm, count with 60 buckets;

+--------------------+-----------+----------+--------------------------------------------------+
| Table              | Op        | Msg_type | Msg_text                                         |
+--------------------+-----------+----------+--------------------------------------------------+
| test_db.production | histogram | status   | Histogram statistics created for column 'count'. |
| test_db.production | histogram | status   | Histogram statistics created for column 'tm'.    |
+--------------------+-----------+----------+--------------------------------------------------+

再次创建直方图时,将会将上一个直方图重写。

如果需要删除已经创建的直方图,用DROPHISTOGRAM就可以实现:

sql 复制代码
analyze table production drop histogram on tm, count;

+--------------------+-----------+----------+--------------------------------------------------+
| Table              | Op        | Msg_type | Msg_text                                         |
+--------------------+-----------+----------+--------------------------------------------------+
| test_db.production | histogram | status   | Histogram statistics removed for column 'count'. |
| test_db.production | histogram | status   | Histogram statistics removed for column 'tm'.    |
+--------------------+-----------+----------+--------------------------------------------------+

直方图统计了表中某些字段的数据分布情况,为优化选择高效的执行计划提供参考。直方图与索引有着本质的区别:维护一个索引有代价,每一次的INSERT、UPDATE、DELETE都会需要更新索引,会对性能有一定 的影响;而直方图一次创建永不更新,除非明确去更新它,所以不会影响INSERT、UPDATE、DELETE的性能。

建立直方图的时候,MySQL服务器会将所有数据读到内存中,然后在内存中进行操作,包括排序。如果对一个很大的表建立直方图,可能会需要将几百兆的数据都读到内存中。为了规避这种风险,MySQL会根据给定的histogram_generation_max_mem_size的值计算该将多少行数据读到内存中。

设置histogram_generation_max_mem_size值的方法如下:

sql 复制代码
mysql>SET histogram_generation_max_mem_size = 10000;

6、综合案例

创建数据库index_test,按照下面表结构在index_test数据库中创建两个数据表test_table1和test_table2,如表所示,并按照操作过程完成对数据表的基本操作。

创建数据库index_test。

sql 复制代码
CREATE database index_test;

结果显示创建成功。在index_test数据库中创建表,必须先选择该数据库,输入语句如下:

sql 复制代码
use index_test;

创建表test_table1。

sql 复制代码
create table test_table1
(
	id int not null primary key auto_increment,
	name char(100) not null,
	address char(100) not null,
	description char(100) not null,
	unique index UniqIdx(id),
	index MultiColIdx(name(20), address(30)),
	index ComIdx(description(30))
);

使用SHOW语句查看索引信息:

sql 复制代码
show create table test_table1 \G;

***************************[ 1. row ]***************************
Table        | test_table1
Create Table | CREATE TABLE `test_table1` (
  `id` int NOT NULL AUTO_INCREMENT,
  `name` char(100) NOT NULL,
  `address` char(100) NOT NULL,
  `description` char(100) NOT NULL,
  PRIMARY KEY (`id`),
  UNIQUE KEY `UniqIdx` (`id`),
  KEY `MultiColIdx` (`name`(20),`address`(30)),
  KEY `ComIdx` (`description`(30))
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb3

由结果可以看到,test_table1表中成功创建了3个索引,分别是:在id字段上名称为UniqIdx的唯一索引;在name和address字段上的组合索引,两个索引列的长度分别为20个字符和30个字符;在description字段上长度为30的普通索引。

创建表test_table2,存储引擎为MyISAM。

sql 复制代码
create table test_table2
(
	id int not null primary key auto_increment,
	firstname char(100) not null,
	middlename char(100) not null,
	lastname char(100) not null,
	birth date not null,
	title char(100) null
) engine = MyISAM;

使用ALTER TABLE语句在表test_table2的birth字段上建立名称为ComDateIdx的普通索引。

sql 复制代码
alter table test_table2 add index ComDateIdx(birth);

使用CREATE INDEX在title字段上建立名称为FTIdx的全文索引。

sql 复制代码
create fulltext index FTIdx on test_table2(title);

使用DROP INDEX语句删除表test_table2中名称为ComDateIdx的普通索引。

sql 复制代码
drop index ComDateIdx on test_table2;

7、常见问题

7.1、索引对数据库性能如此重要,应该如何使用它?

为数据库选择正确的索引是一项复杂的任务。如果索引列较少,则需要的磁盘空间和维护开销都较少。如果在一个大表上创建了多种组合索引,索引文件也会膨胀很快。另一方面,索引较多可覆盖更多的查询。可能需要试验若干不同的设计,才能找到最有效的索引。可以添加、修改和删除索引而不影响数据库架构或应用程序设计。因此,应尝试多个不同的索引从而建立最优的索引。

7.2、尽量使用短索引。

对字符串类型的字段进行索引,如果可能,应该指定一个前缀长度。例如,有一个CHAR(255)的列,如果在前10个或30个字符内,多数值是唯一的,则不需要对整个列进行索引。短索引不仅可以提高查询速度,还可以节省磁盘空间、减少I/O操作。