SQL优化--主键查询

在上一小节,我们提到,主键顺序插入的性能是要高于乱序插入的。 这一小节,就来介绍一下具体的 原因,然后再分析一下主键又该如何设计。

数据组织方式

在InnoDB存储引擎中,表数据都是根据主键顺序组织存放的,这种存储方式的表称为索引组织表 (index organized table IOT)。

在innoDB中索引分两类,聚集索引和二级索引,聚集索引下挂的是行数据,而二级索引挂的是主键。而默认主键索引就是聚集索引。所以我们表中的数据是按照主键进行顺序存储的

逻辑存储结构

最外面是表空间Tablespace,里面存储的是一个个Segment段,段中存储的是Extent区,而一个区的大小是固定的,是1m。区当中存储的是一个个Page页,页里存储的是Row行,行中存储的就是字段。

在InnoDB引擎中,数据行是记录在逻辑结构 page 页中的,而每一个页的大小是固定的,默认16K,一个区最多包含64个页。 那也就意味着, 一个页中所存储的行也是有限的,如果插入的数据行row在该页存储不小,将会存储 到下一个页中,页与页之间会通过指针连接。

页分裂

页可以为空,也可以填充一半,也可以填充100%。每个页包含了2-N行数据(如果一行数据过大,会行溢出,而如果只存储一个其实就变成了链表),根据主键排列

主键顺序插入

从磁盘中申请页, 主键顺序插入

第一个页没有满,继续往第一页插入

当第一个也写满之后,再写入第二个页,页与页之间会通过双向指针连接

当第二页写满了,再往第三页写入

主键乱序插入

加入1#,2#页都已经写满了,存放了如图所示的数据

此时再插入id为50的记录,我们来看看会发生什么现象?会再次开启一个页,写入新的页中吗?

不会。因为,索引结构的叶子节点是有顺序的。按照顺序,应该存储在47之后。但是47所在的1#页,已经写满了,存储不了50对应的数据了。 那么此时会开辟一个新的页 3#。然后会将1#页后一半的数据,移动到3#页,然后在3#页,插入50。

移动数据,并插入id为50的数据之后,那么此时,这三个页之间的数据顺序是有问题的。 1#的下一个 页,应该是3#, 3#的下一个页是2#。 所以,此时,需要重新设置链表指针。

上述的这种现象,称之为 "页分裂",是比较耗费性能的操作。

页合并

当删除一行记录时,实际上记录并没有被物理删除,只是记录被标记(flaged)为删除并且它的空间 变得允许被其他记录声明使用。

当页中删除的记录达到 MERGE_THRESHOLD(默认为页的50%),InnoDB会开始寻找最靠近的页(前或后)看看是否可以将两个页合并以优化空间使用。

这个里面所发生的合并页的这个现象,就称之为 "页合并"。

MERGE_THRESHOLD:合并页的阈值,可以自己设置,在创建表或者创建索引时指定。

主键设计原则

满足业务需求的情况下,尽量降低主键的长度。

插入数据时,尽量选择顺序插入,选择使用AUTO_INCREMENT自增主键。

尽量不要使用UUID做主键或者是其他自然主键,如身份证号。

业务操作时,避免对主键的修改。

相关推荐
zfoo-framework几秒前
通过redis-cli+lua脚本查询redis数据
数据库·redis·lua
牛栓柱13 分钟前
【后端实战】用 Supabase + React/TS 零成本构建高并发 Multi-Agent 服务
前端·数据库·人工智能·后端·react.js·前端框架
yuezhilangniao17 分钟前
xtr备份prepare到底变化了啥
mysql
yyk的萌18 分钟前
创建属于自己的mysql的mcp
mysql·adb·ai·mcp
流烟默18 分钟前
腾讯云Centos7.6使用yum安装MySQL8
mysql·centos·腾讯云
仙俊红23 分钟前
如何优化 MySQL 深分页 SQL
android·sql·mysql
yyuuuzz1 小时前
谷歌云基础服务的入门认知
linux·运维·服务器·数据库·人工智能·github
超梦dasgg1 小时前
工作中 MySQL 读写分离主从延迟:成因、影响、落地方案、生产实战处理
数据库·mysql
Wonderful U1 小时前
Python+Django实战:打造智能生鲜果蔬进销存管理系统(采购入库、库存预警、销售开单、毛利统计)
数据库·python·django
Demon1_Coder1 小时前
Day4-微服务-Seata默认事务
java·数据库·微服务