Mysql 索引

1.基本概念:

在MySQL中,索引(Index)是用于提高查询速度的一种数据结构。索引类似于书的目录,通过建立索引,可以快速找到数据在表中的位置,而无需扫描整个表。索引在优化数据库查询性能方面起着非常重要的作用,但也会带来一些额外的存储空间开销和维护成本。

2.类型:

(1).主键索引:数据列不允许重复,不允许为NULL,一个表只有一个主键。

(2).唯一索引:数据列不允许重复,允许为NULL,一个表允许多个列创建唯一索引。

(3).普通索引:基本的索引类型,没有唯一性的限制,允许为NULL值。

(4).全文索引:是目前搜索引擎使用的一种关键技术,对文本的内容进行分词、搜索。

3.结构:

MySQL 索引的实现依赖于存储引擎,不同的存储引擎索引结构有所不同:

  • B-Tree 索引: 这是大多数存储引擎使用的默认索引类型,如 InnoDB 和 MyISAM。B-Tree 索引适用于全值匹配、范围查询、前缀匹配等。

  • Hash 索引: 只有 Memory 引擎支持的索引类型,适用于精确查询,不支持范围查询。其特点是查询速度极快,但由于不存储顺序信息,无法用于排序操作。

  • 全文索引(Full-Text): 使用倒排索引(Inverted Index),主要用于全文搜索。适用于大量文本内容的模糊查询。

  • R-Tree 索引: 主要用于空间数据的存储,常用于地理信息系统(GIS)

4.工作原理

MySQL 索引的实现基于数据结构,如 B-Tree(B+树)和哈希表:

  • B-Tree(B+树) 索引工作原理: B-Tree 是一种平衡树数据结构,节点按照关键字顺序排列,每个节点保存索引的关键字和数据指针。在查询时,MySQL 会从根节点开始搜索,通过比较关键字大小进入相应的子节点,直到查找到目标数据。这个过程通常是 O(log n) 的时间复杂度,非常高效。

  • Hash 索引工作原理: 哈希索引基于哈希表实现,将索引字段的值通过哈希函数转换为一个特定的地址,查找速度很快。适用于精确匹配查询,但不适用于范围查询。

聚簇索引:

按照主键或唯一约束条件来组织数据,查询效率高,但插入、更新和删除操作可能会影响写入性能。

非聚簇索引:

独立于表的物理存储方式,可以包含多个索引,查询效率相对于聚簇索引较低,但对插入、更新和删除操作的影响较小。

二者核心区别:数据和索引是否绑定在一起,聚簇索引是绑定在一起的而非聚簇索引是没有绑定在一起的。

5.语法

(1).创建索引

可以使用CREATE INDEX语句或在创建表时定义索引:

sql 复制代码
-- 创建表时添加索引
CREATE TABLE example (
  id INT AUTO_INCREMENT,
  name VARCHAR(100),
  age INT,
  PRIMARY KEY (id),
  UNIQUE KEY unique_name (name),
  INDEX index_age (age)
);

-- 在已有表上添加索引
CREATE INDEX index_name ON example (name);

(2).查看索引

可以使用SHOW INDEX命令查看表中的索引信息:

sql 复制代码
SHOW INDEX FROM example;

(3).删除索引

可以使用DROP INDEX语句删除索引:

sql 复制代码
DROP INDEX index_name ON example;

6.失效的场景:

(1).使用LIKE通配符时

LIKE的查询模式以通配符(如%)开头时,索引会失效,因为MySQL需要对每一行进行全表扫描。

sql 复制代码
-- 索引失效
SELECT * FROM users WHERE name LIKE '%abc';

(2).使用OR条件时

如果OR的任意一边没有使用索引,那么MySQL将放弃使用索引,进行全表扫描。

sql 复制代码
-- 索引失效,如果只有name列有索引
SELECT * FROM users WHERE name = 'Alice' OR age = 25;

(3).对索引列进行函数操作

如果在查询条件中对索引列进行了函数操作或表达式计算,索引会失效。

sql 复制代码
-- 索引失效,因为对索引列进行了函数操作
SELECT * FROM users WHERE LOWER(name) = 'alice';

(4).对索引列进行隐式类型转换

如果索引列的数据类型与查询条件的类型不匹配,MySQL会进行隐式类型转换,从而导致索引失效。

sql 复制代码
-- 索引失效,因为name是VARCHAR类型,'123'是字符串
SELECT * FROM users WHERE name = 123;

(5).使用不等于运算符(!=<>

当使用不等于运算符(!=<>)时,MySQL无法使用索引,因为需要扫描大部分数据行。

sql 复制代码
-- 索引失效
SELECT * FROM users WHERE age != 30;

(6).使用IS NULLIS NOT NULL

对于某些类型的索引,使用IS NULLIS NOT NULL时,索引会失效,因为它们需要扫描所有记录来查找空值或非空值。

sql 复制代码
-- 索引失效
SELECT * FROM users WHERE name IS NULL;

(7) .联合索引未按最左前缀原则使用

联合索引(如(a, b, c))需要按照"最左前缀"原则使用。如果查询条件不从索引的最左边列开始,索引将失效。

sql 复制代码
-- 索引失效,因为没有使用最左前缀a
SELECT * FROM users WHERE b = 2;

(8). 数据分布不均导致的索引失效

如果索引列的数据分布极为不均(如大多数值相同,只有少数不同),MySQL优化器可能会选择放弃使用索引。

解决方法:考虑重新设计索引或调整数据分布

(9).使用%通配符前后都有时

LIKE查询模式前后都有%通配符时,索引也会失效:

sql 复制代码
-- 索引失效
SELECT * FROM users WHERE name LIKE '%abc%';

解决方法:避免这种形式,尽量使用有明确前缀或后缀的模式。

7.优缺点:

优点

  • 加速数据的检索速度,减少查询时间。

  • 在某些情况下,使用索引可以优化排序操作。

  • 可以显著提高系统的性能。
    缺点

  • 索引需要占用物理存储空间。

  • 索引的维护会带来额外的开销(如增删改操作时需要更新索引)。

  • 不适合频繁更新的列上使用索引。

8. 总结:

合理地使用索引可以大大提高MySQL数据库的性能,但需要根据具体的应用场景来选择和管理索引。

相关推荐
云和数据.ChenGuang1 小时前
Django 应用安装脚本 – 如何将应用添加到 INSTALLED_APPS 设置中 原创
数据库·django·sqlite
woshilys2 小时前
sql server 查询对象的修改时间
运维·数据库·sqlserver
Hacker_LaoYi2 小时前
SQL注入的那些面试题总结
数据库·sql
建投数据3 小时前
建投数据与腾讯云数据库TDSQL完成产品兼容性互认证
数据库·腾讯云
Hacker_LaoYi4 小时前
【渗透技术总结】SQL手工注入总结
数据库·sql
岁月变迁呀4 小时前
Redis梳理
数据库·redis·缓存
独行soc4 小时前
#渗透测试#漏洞挖掘#红蓝攻防#护网#sql注入介绍06-基于子查询的SQL注入(Subquery-Based SQL Injection)
数据库·sql·安全·web安全·漏洞挖掘·hw
你的微笑,乱了夏天5 小时前
linux centos 7 安装 mongodb7
数据库·mongodb
工业甲酰苯胺5 小时前
分布式系统架构:服务容错
数据库·架构
独行soc6 小时前
#渗透测试#漏洞挖掘#红蓝攻防#护网#sql注入介绍08-基于时间延迟的SQL注入(Time-Based SQL Injection)
数据库·sql·安全·渗透测试·漏洞挖掘