MySQL 索引原理与优化实战指南:从失效场景到联合索引设计

文章目录

一、MySQL中索引一定有效吗?如何排查索引的效果?

  1. 不一定有效,不一定会用到索引,使用索引不一定不全表查询快
  2. MySQL最终是否走索引,靠的是优化器的最终计算,优化器会计算走索引和全表扫描各自的IO成本和CPU成本,哪个成本低就选哪个。
  3. 排查索引用explain+查询语句 ,重点看下面的几个字段type、row、key、extra.
    • type: ALL表示全表扫描、index表示全索引扫描、range表示范围扫描、ref表示等值扫描
    • rows: 预估扫描行数,行数越大说明成本越高
    • key: 实际使用的索引名,null表示没有用到索引(全表扫描)
    • extra:using index表示使用联合索引,不用回表、using index condition表示经过了回表

二、索引失效的场景

索引失效是面试高频考点,场景不少,但背后的原因基本就两类:一是查询条件导致索引树的快速查找能力用不上,二是优化器算了一笔账觉得不划算。

  1. 违反最左匹配原则
  2. 索引列上做了运算
  3. 索引列上使用了函数
  4. like左侧带%号的模糊查询
  5. 用or关键字关联非索引字段
    • where name = 'lyq' or age = 20, 如果age没有索引,MySQL没有办法通过索引快速过滤age条件,整个查询可能退化成全表查询。
  6. 隐式的类型转换
    • name是varcher类型,查询写成了where name = 1
  7. 优化器认为全表扫描更划算
    • 同一个索引,热点数据可能会走全表扫描,而冷门数据会走索引,因为,热点数据多,走索引会产生大量的回表操作,不如全表扫描
  8. group by 后的字段没有索引

三、什么是索引下推?

索引下推是MySQL5.6引入的优化技术,目的是减少回表次数,提升查询效率。

核心思路是把部分条件过滤下推到引擎层,在引擎层就把不符合的数据过滤掉,不用再回表查询所有数据。

  • 以前的流程是:引擎层通过索引定位数据,返回主键给Server层,Server层回表拿去所有数据,再通过剩下的条件过滤数据。
  • 有了索引下推,引擎层就能直接通过索引里的列过滤不符合的数据,不符合的数据就不需要回表操作。
  • 索引下推主要用在联合索引中

四、建索引时的注意事项

索引不是越多越好,每个索引都占磁盘空间,每次写入都要维护索引的B+树,索引越多插入效率越低。

  1. 区分度太低的字段不要建立索引,比如说性别,就两个值,建了索引也没什么过滤效果,不过也有例外,比如说定时任务表,大部分都是成功,只有少量失败,通过失败状态查询能过滤掉大量的数据,这时候的建索引就是有意义的。
  2. 大字段不要建立索引。
  3. 写多读少的字段不要建立索引。
  4. 频繁查询的字段要建立索引
  5. distinctgroup byorder by 后面的字段要建立索引。

五、联合索引的设计原则

  1. 区分度高的放前面
  2. 查询效率高的放前面
  3. 范围查询的放后面
  4. 利用覆盖查询

六、联合索引和多个单例索引的区别

联合索引是一颗B+树,多个单例索引是多个B+树,查询时,单例索引通常只能走一个索引,而联合索引能同时利用多个列过滤。

相关推荐
desert_xu2 小时前
ORA-20079 错误栗子
数据库·oracle
APItesterCris2 小时前
商品详情 API 的签名验证与安全接入技术要点
大数据·数据库·安全·架构
阳光九叶草LXGZXJ2 小时前
达梦数据库-学习-41-表大小快速估算
linux·运维·数据库·sql·学习
大鹅同志2 小时前
Ubuntu 20.04使用MB-System分析与可视化EM3000数据
数据库·3d·ros·slam·mb-system
萧曵 丶2 小时前
缓存与数据库双写一致性
数据库·缓存
余道各努力,千里自同风2 小时前
node.js 操作 MongoDB
数据库·mongodb·node.js
oMcLin2 小时前
如何在 Fedora 34 上通过配置 MongoDB 集群,提升电商平台的用户数据存储与查询响应速度?
数据库·mongodb
green__apple3 小时前
Oracle普通分区表转自动分区表
数据库·oracle
MediaTea3 小时前
Python OOP 设计思想 13:封装服务于演化
linux·服务器·前端·数据库·python