MySQL-索引:聚集索引、覆盖索引、组合索引、前缀索引、唯一索引(附带例子解释)

MySQL-索引:聚集索引、覆盖索引、组合索引、前缀索引、唯一索引(附带例子解释)

1、聚集索引

  • 在数据库中,聚集索引决定了表数据行的物理存储顺序 。在InnoDB存储引擎 中,每个表都有一个聚簇索引
  • 聚集索引的叶子节点直接包含行记录的数据(主键值和列数据) ,因此对于查询来说,如果查询条件命中了聚集索引 ,可以直接从索引树找到所需的数据无需回表操作。
  • 一个表只能有一个聚集索引 ,并且通常建议选择那些具有唯一性、访问频繁且高度排序的列作为聚集索引

假设我们有一个用户表users,其中包含以下字段

sql 复制代码
CREATE TABLE users (
    id INT PRIMARY KEY AUTO_INCREMENT, -- 假设这是主键
    username VARCHAR(50),
    email VARCHAR(255),
    created_at TIMESTAMP
);

InnoDB 存储引擎中,默认情况下id作为聚集索引 。这意味着表中的行是按id的升序物理存储的 ,并且每个叶子节点包含了完整的行数据(包括username, email, created_at) 。当你执行如下查询时,可以直接利用聚集索引来快速定位到指定id的数据行

sql 复制代码
SELECT * FROM users WHERE id = 123;

2、覆盖索引

  • 覆盖索引 是指在查询 过程中,只需要通过索引就能获取到所有需要的数据 ,而不需要再回到表 中去查找行记录,这样可以减少磁盘I/O,显著提高查询性能
  • 如果一个查询语句所涉及的所有字段都出现在某个索引中 ,那么这个索引就被称作覆盖索引不仅包括查询列,还包括结果集中所需的其他列如在SELECT列表中的列

对于上述users表,如果我们创建了一个包含所有查询列的复合索引:

sql 复制代码
CREATE INDEX idx_username_email ON users (username, email);

现在执行如下查询:

sql 复制代码
SELECT username, email FROM users WHERE username = 'Alice';

这个查询可以完全使用索引 idx_username_email 来完成,因为索引包含了查询所需的所有列无需回表获取其他列数据,这就是一个覆盖索引的例子。

3、组合索引

同样以上述的idx_username_email为例,它是一个基于username和email两个列创建的组合索引。当执行如下的查询时,由于遵循了最左前缀原则,可以有效利用该索引:

sql 复制代码
-- 可以利用索引
SELECT * FROM users WHERE username = 'Bob' AND email LIKE '%example.com';

-- 不会利用索引(仅使用了索引的一部分)
SELECT * FROM users WHERE email LIKE '%example.com';

4、前缀索引

考虑一个文章表articles,其内容字段content非常大:

sql 复制代码
CREATE TABLE articles (
    id INT PRIMARY KEY AUTO_INCREMENT,
    title VARCHAR(255),
    content TEXT
);

为了减少索引空间占用并加速对title列的模糊查询,我们可以只对title的前几个字符创建前缀索引:

sql 复制代码
CREATE INDEX idx_title_prefix ON articles (SUBSTR(title, 1, 10));

这样,在执行如下查询时就可以利用前缀索引进行优化:

sql 复制代码
SELECT * FROM articles WHERE title LIKE 'Introduction%';

5、唯一索引

在users表中,id列已经是一个主键,自动带有唯一约束。如果还需要确保邮箱地址的唯一性,可以添加一个唯一索引:

sql 复制代码
ALTER TABLE users ADD UNIQUE INDEX idx_unique_email (email);

此时,尝试插入重复邮箱地址的记录将会失败:

sql 复制代码
INSERT INTO users (username, email) VALUES ('Charlie', 'charlie@example.com');
INSERT INTO users (username, email) VALUES ('David', 'charlie@example.com'); -- 这条语句将抛出违反唯一约束的错误

6、再深入理解覆盖索引

假设我们有一个销售订单表orders,包含以下字段:

sql 复制代码
CREATE TABLE orders (
    order_id INT PRIMARY KEY AUTO_INCREMENT,
    customer_id INT,
    product_id INT,
    order_date DATE,
    quantity INT,
    price DECIMAL(10,2)
);

为了优化如下的查询性能,我们可以创建一个覆盖索引:

sql 复制代码
SELECT customer_id, product_id, SUM(quantity) as total_quantity 
FROM orders 
WHERE order_date BETWEEN '2021-01-01' AND '2021-12-31'
GROUP BY customer_id, product_id;

这个查询需要检索在指定日期范围内的所有订单,并按客户ID和产品ID进行分组并计算数量总和。为了使这个查询能使用覆盖索引,我们需要创建一个包括order_date, customer_id, product_id以及quantity的索引

sql 复制代码
CREATE INDEX idx_covering ON orders (order_date, customer_id, product_id, quantity);

现在,当执行上述查询时,MySQL可以直接从索引idx_covering中获取到所需的所有数据(customer_id, product_id, quantity),而不需要访问实际的数据行,从而显著提高了查询效率。这就是覆盖索引的应用实例。

7、拓展

索引对WHERE子句中的列名起作用,同时也可以在SELECT子句中发挥作用。但具体情况取决于索引的类型和查询的执行计划。

1)对WHERE条件中的列名起作用:

当SQL查询语句包含WHERE子句 时,如果该子句涉及的列有索引 ,数据库系统可以根据索引快速定位到符合条件的数据行 ,从而++减少磁盘I/O和扫描的数据量,显著提升查询性能++ 。

例如:

sql 复制代码
   SELECT * FROM orders WHERE order_id = 123;

如果order_id上有索引,那么这个查询可以迅速定位到特定记录。
2)对SELECT子句中的列名间接起作用(覆盖索引):

如果创建了一个覆盖索引,即索引包含了查询所需要的所有列 ,那么数据库在执行查询时无需回表获取其他列数据,直接从索引中获取结果 ,这种情况下索引也++对SELECT子句起到了优化效果++ 。

例如:

sql 复制代码
   CREATE INDEX idx_orders ON orders (order_date, customer_id);
   SELECT customer_id FROM orders WHERE order_date BETWEEN '2021-01-01' AND '2021-12-31';

在这个例子中,虽然我们是从SELECT子句中选择customer_id,但由于idx_orders索引已经包含了查询所需的order_date和customer_id字段,因此能够通过索引来完成整个查询过程 ,实现所谓的"覆盖索引 "。

总之,索引主要用于提高WHERE子句中条件过滤的速度 ,并且在满足特定条件的情况 下,也能有效优化SELECT子句所涉及的列的查询效率

相关推荐
瓜牛_gn21 分钟前
mysql特性
数据库·mysql
奶糖趣多多1 小时前
Redis知识点
数据库·redis·缓存
数新网络2 小时前
《深入浅出Apache Spark》系列②:Spark SQL原理精髓全解析
大数据·sql·spark
CoderIsArt2 小时前
Redis的三种模式:主从模式,哨兵与集群模式
数据库·redis·缓存
师太,答应老衲吧4 小时前
SQL实战训练之,力扣:2020. 无流量的帐户数(递归)
数据库·sql·leetcode
Yaml45 小时前
Spring Boot 与 Vue 共筑二手书籍交易卓越平台
java·spring boot·后端·mysql·spring·vue·二手书籍
Channing Lewis5 小时前
salesforce case可以新建一个roll up 字段,统计出这个case下的email数量吗
数据库·salesforce
追风林6 小时前
mac 本地docker-mysql主从复制部署
mysql·macos·docker
毕业设计制作和分享7 小时前
ssm《数据库系统原理》课程平台的设计与实现+vue
前端·数据库·vue.js·oracle·mybatis
ketil277 小时前
Redis - String 字符串
数据库·redis·缓存