目录
[3.B-Tree 索引](#3.B-Tree 索引)
1.索引介绍
索引:是排序的快速查找的特殊数据结构,定义作为查找条件的字段上,又称为键key,索引通过存储引擎实现
1.索引的概念
-
索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址(类似于C语言的链表通过指针指向数据记录的内存地址)。
-
使用索引后可以不用扫描全表来定位某行的数据,而是先通过索引表找到该行数据对应的物理地址然后访问相应的数据,因此能加快数据库的查询速度。
-
索引就好比是一本书的目录,可以根据目录中的页码快速找到所需的内容。
-
索引是表中一列或者若干列值排序的方法。
-
建立索引的目的是加快对表中记录的查找或排序。
2.索引的优点
●加快查询速度,提高数据库性能
●设置了合适的索引之后,数据库利用各种快速定位技术,能够大大加快查询速度,这是创建索引的最主要的原因。
●当表很大或查询涉及到多个表时,使用索引可以成千上万倍地提高查询速度。避免排序和使用临时表
●可以降低数据库的IO成本(减少io次数),并且索引还可以降低数据库的排序成本。将随机I/O转为顺序I/O
●通过创建唯一性索引,可以保证数据表中每一行数据的唯一性。
●可以加快表与表之间的连接。
●在使用分组和排序时,可大大减少分组和排序的时间。
●建立索引在搜索和恢复数据库中的数据时能显著提高性能
3.索引的缺点
- 占用额外的磁盘空间,影响插入速度 占用磁盘空间
4.创建索引的原则依据
索引虽可以提升数据库查询的速度,但并不是任何情况下都适合创建索引。因为索引本身会消耗系统资源,在有索引的情况下,数据库会先进行索引查询,然后定位到具体的数据行,如果索引使用不当,反而会增加数据库的负担。
●表的主键、外键必须有索引。因为主键具有唯一性,外键关联的是主表的主键,查询时可以快速定位。
●记录数超过300行的表应该有索引。如果没有索引,每次查询都需要把表遍历一遍,会严重影响数据库的性能。
●经常与其他表进行连接的表,在连接字段上应该建立索引。
●唯一性太差的字段不适合建立索引。
●更新太频繁地字段不适合创建索引。
●经常出现在 where 子句中的字段,特别是大表的字段,应该建立索引。
●在经常进行 GROUP BY、ORDER BY 的字段上建立索引;
●索引应该建在选择性高的字段上。
●索引应该建在小字段上,对于大的文本字段甚至超长字段,不要建索引。
5.索引的优化
-
独立地使用列:尽量避免其参与运算,独立的列指索引列不能是表达式的一部分,也不能是函数的参数,在where条件中,始终将索引列单独放在比较符号的一侧,尽量不要在列上进行运算(函数操作和表达式操作)
-
左前缀索引:构建指定索引字段的左侧的字符数,要通过索引选择性(不重复的索引值和数据表的记录总数的比值)来评估,尽量使用短索引,如果可以,应该制定一个前缀长度
-
多列索引:AND操作时更适合使用多列索引,而非为每个列创建单独的索引
-
选择合适的索引列顺序:无排序和分组时,将选择性最高放左侧
-
只要列中含有NULL值,就最好不要在此列设置索引,复合索引如果有NULL值,此列在使用时也不会使用索引
-
对于经常在where子句使用的列,最好设置索引
-
对于有多个列where或者order by子句,应该建立复合索引
-
对于like语句,以 % 或者 _ 开头的不会使用索引,以 % 结尾会使用索引
-
尽量不要使用not in和<>操作,虽然可能使用索引,但性能不高
-
不要使用RLIKE正则表达式会导致索引失效
-
查询时,能不要就不用,尽量写全字段名,比如:select id,name,age from students;
-
大部分情况连接效率远大于子查询
-
在有大量记录的表分页时使用limit
-
对于经常使用的查询,可以开启查询缓存
-
多使用explain和profile分析查询语句
-
查看慢查询日志,找出执行时间长的sql语句优化
2.索引的分类
1.索引的类型
-
B+ TREE、HASH、R TREE、FULL TEXT
-
聚簇(集)索引、非聚簇索引:数据和索引是否存储在一起
-
主键索引、二级(辅助)索引
-
稠密索引、稀疏索引:是否索引了每一个数据项
-
简单索引、组合索引: 是否是多个字段的索引
-
左前缀索引:取前面的字符做索引
-
覆盖索引:从索引中即可取出要查询的数据,性能高
2.索引结构
参考链接 : https://www.cs.usfca.edu/~galles/visualization/Algorithms.html
1.二叉树
参考链接: https://www.cs.usfca.edu/~galles/visualization/BST.html
2.红黑树
参考链接:https://www.cs.usfca.edu/~galles/visualization/RedBlack.html
3.B-Tree 索引
参考链接: https://www.cs.usfca.edu/~galles/visualization/BTree.html
缺点:
1.连续范围查找都要从头开始,效率不稳定,快的很快,慢的就比较慢
2.所存数据量越大,查找次数越
4.B+Tree索引
参考链接: https://www.cs.usfca.edu/~galles/visualization/BPlusTree.html
B+Tree索引:按顺序存储,每一个叶子节点到根结点的距离是相同的;左前缀索引,适合查询范围类的数据
3.准备库和数据
3.1创建数据库和表
create database school;
use school
create table shuju (id int(4),name char(10) not null,cardid char(20),phone char(11),address char(30),remark text);
3.2插入7条数据
mysql> insert into shuju values(1,'xzq',123,11111,'shanghai','this is gs');
Query OK, 1 row affected (0.01 sec)
mysql> insert into shuju values(2,'hyb',1234,22222,'hangzhou','this is tn');
Query OK, 1 row affected (0.01 sec)
mysql> insert into shuju values(3,'cyq',12345,33333,'taiwang','this is lp');
Query OK, 1 row affected (0.01 sec)
mysql> insert into shuju values(4,'lhz',123456,44444,'zhejiang','this is jj');
Query OK, 1 row affected (0.00 sec)
mysql> insert into shuju values(5,'lh',1234567,55555,'beijing','this is ad');
Query OK, 1 row affected (0.00 sec)
mysql> insert into shuju values(6,'zyx',12345678,66666,'hunan','this is wt');
Query OK, 1 row affected (0.01 sec)
mysql> insert into shuju values(7,'kcy',123456789,77777,'nanjing','this is fp');
3.3查看数据
describe shuju;
select * from shuju;
4.索引的创建
4.1普通索引
最基本的索引类型,没有唯一性之类的限制。
4.1.1直接创建索引
CREATE INDEX 索引名 ON 表名 (列名[(length)]);
#(列名(length)):length是可选项。
如果忽略 length 的值,则使用整个列的值作为索引。
如果指定使用列前的 length 个字符来创建索引,这样有利于减小索引文件的大小。
#索引名建议以"_index"结尾。
例:create index phone_index on shuju(phone);
select phone from shuju;
show create table shuju;
查看索引内容
show create table shuju;
4.1.2修改的方式添加索引
ALTER TABLE 表名 ADD INDEX 索引名 (列名);
例:alter table shuju add index id_index(id);
select id from shuju;
show create table shuju\G;
4.1.3创建表的时候指定索引
CREATE TABLE 表名 ( 字段1 数据类型,字段2 数据类型[,...],INDEX 索引名 (列名));
例:create table t1 (id int(4) not null,name varchar(10) not null,cardid varchar(18) not null,index id_index(id));
show create table t1\G;
4.2唯一索引
与普通索引类似,但区别是唯一索引列的每个值都唯一。
唯一索引允许有空值(注意和主键不同)。如果是用组合索引创建,则列值的组合必须唯一。
添加唯一键将自动创建唯一索引。
4.2.1直接创建唯一索引
CREATE UNIQUE INDEX 索引名 ON 表名(列名);
例:select * from shuju;
create unique index name_index on shuju (name);
show create table shuju;
4.2.2修改的方式添加创建
ALTER TABLE 表名 ADD UNIQUE 索引名 (列名);
例:alter table shuju add unique cardid_index (cardid);
show create table shuju\G;
4.2.3创建表的时候指定
CREATE TABLE 表名 (字段1 数据类型,字段2 数据类型[,...],UNIQUE 索引名 (列名));
例: create table t2 (id int,name varchar(20),unique id_index(id));
show creat table t2;
4.3主键索引
是一种特殊的唯一索引,必须指定为"PRIMARY KEY"。
一个表只能有一个主键,不允许有空值。 添加主键将自动创建主键索引。
4.3.1创建表的时候指定
CREATE TABLE 表名 ([...],PRIMARY KEY (列名));
例:create table t3 (id int,name char(20),primary key(id));
show create table t3;
4.3.2修改的方式添加创建
ALTER TABLE 表名 ADD PRIMARY KEY (列名);
######################
create table t5 (id int not null,name char(10));
####创建一个表
alter table t5 add primary key(id);
########创建主键索引
show create table t5;
4.4组合索引
可以是单列上创建的索引,也可以是在多列上创建的索引。
CREATE TABLE 表名 (列名1 数据类型,列名2 数据类型,列名3 数据类型,INDEX 索引名 (列名1,列名2,列名3));
select * from 表名 where 列名1='...' AND 列名2='...' AND 列名3='...';
例:create table t6 (id int not null,name char(20),cardid char(20),index index_lg(id,name));
########创建组合索引
show create table t6;
#######查看表数据
插入数据,看表数据
insert into t6 values(1,'xzq','123456');
######插入数据
select id,name from t6;
####查看指定数据
注意:
组合索引创建的字段顺序是,触发索引的查询顺序
--+
| CLASS | CREATE TABLE "member" (
"id" int(11) NOT NULL,
"name" varchar(50) DEFAULT NULL,
"age" int(5) DEFAULT NULL,
KEY "index_idname" ("id","name")
) ENGINE=InnoDB DEFAULT CHARSET=utf8 |
对以上的表进行select
select id,name from member; #会触发组合索引
而:
select name,id from member; #按照索引从左到右检索的顺序,则不会触发组合索引
大量数据才能展示是否出发组合索引,未触发查询速度慢。
4.5全文索引
适合在进行模糊查询的时候使用,可用于在一篇文章中检索文本信息。
在 MySQL5.6 版本以前FULLTEXT 索引仅可用于 MyISAM 引擎,在 5.6 版本之后 innodb 引擎也支持FULLTEXT 索引。
全文索引可以在 CHAR、VARCHAR 或者 TEXT 类型的列上创建。每个表只允许有一个全文索引。
4.5.1直接创建索引
CREATE FULLTEXT INDEX 索引名 ON 表名 (列名);
例:select * from shuju;
create fulltext index remark_index on shuju(remark);
####设置remark字段为全文索引
查看表数据
show create table shuju\G;
4.5.2修改的方法添加索引
ALTER TABLE 表名 ADD FULLTEXT 索引名 (列名);
############################
alter table shuju add fulltext address_index(address);
####添加address字段为全文索引
show create table shuju\G;
###查看表数据
4.5.3创建表的时候指定索引
CREATE TABLE 表名 (字段1 数据类型[,...],FULLTEXT 索引名 (列名));
create table t8(id int not null,name char(10),fulltext name_index(name));
####创建表t8时,创建全文索引name
show create table t8;
####查看表数据
4.5.4使用全文索引查询
SELECT * FROM 表名 WHERE MATCH(列名) AGAINST('查询内容');
例:select * from shuju where match(address) against('shanghai');
5.查看索引
show index from 表名;
show index from 表名\G; 竖向显示表索引信息
show keys from 表名;
show keys from 表名\G;
字段含义:
|--------------|------------------------------------------------|
| Table | 表的名称 |
| Non_unique | 如果索引不能包括重复词,则为 0;如果可以,则为 1。 |
| Key_name | 索引的名称。 |
| Seq_in_index | 索引中的列序号,从 1 开始。 |
| Column_name | 列名称。 |
| Collation | 列以什么方式存储在索引中。在 MySQL 中,有值'A'(升序)或 NULL(无分类)。 |
| Cardinality | 索引中唯一值数目的估计值。 |
| Sub_part | 如果列只是被部分地编入索引,则为被编入索引的字符的数目。如果整列被编入索引,则为 NULL。 |
| Packed | 指示关键字如何被压缩。如果没有被压缩,则为 NULL。 |
| Null | 如果列含有 NULL,则含有 YES。如果没有,则该列含有 NO。 |
| Index_type | 用过的索引方法(BTREE, FULLTEXT, HASH, RTREE)。 |
| Comment | 备注。 |
6.删除索引
6.1直接删除索引
DROP INDEX 索引名 ON 表名;
例:drop index name_index on shuju;
show index from shuju;
6.2修改的方式删除索引
ALTER TABLE 表名 DROP INDEX 索引名;
例:alter table shuju drop index id_index;
show index from shuju;
6.3删除主键索引
ALTER TABLE 表名 DROP PRIMARY KEY;
alter table t3 drop primary key;
#####删除t3表中的主键索引
show create table t3;
#####查看表t3的索引内容
删除索引,对字段和数据没有影响
7.总结
7.1索引分类
① 普通索引 :针对所有字段,没有特殊的需求/规则
② 唯一索引 : 针对唯一性的字段,仅允许出现一次空值
③ 组合索引 (多列/多字段组合形式的索引)
④ 全文索引(varchar char text)
⑤ 主键索引 :针对唯一性字段、且不可为空,同时一张表只允许包含一个主键索引
7.2索引创建
① 在创建表的时候,直接指定index
② alter修改表结构的时候,进行add 添加index
③ 直接创建索引index
PS:主键索引------》直接创建主键即可