Innodb存储架构

Innodb整体存储架构

Innodb是一款兼顾性能及可靠性的存储引擎,主要分为内存存储结构和磁盘存储结构,二者分别扮演着提高性能和数据持久化的工作

内存结构中定义了缓冲池、变更缓冲区、日志缓冲区、自适应哈希 四个缓冲区,它们均是为提升查询效率服务的,

磁盘结构中定义了各种表空间,分别是系统表空间、独立表空间、通用表空间、临时表空间、撤销表空间、双写缓冲区,它们均是为了可靠性服务的

表空间文件(*.ibd)

MySQL所有的数据最终都需要刷新到磁盘上进行持久化保证数据安全,必须通过合理的数据结构对庞大的数据集进行组织管理,MySQL默认情况下为每一张表生成一份独立表空间,表空间内部定义了不同的结构进行分层管理数据,从大到小依次段segment,组group,区extent,页page,行line

其中数据存储和查询返回的最小单位是数据行line

而MySQL服务与磁盘IO的最小单位为页page,一页的大小为16kb,页的设计基于局部性原理,尽量的减少访问磁盘的次数,来提高效率

页结构:

页是一次申请的一段连续空间,每一个页由页头,页尾,页主体 构成,其中页主体还能细分为数据页头,首行末行、用户数据区,空闲区、页目录

页主体主要由数据行构成,是存放用户真实数据的区域

页头存放页的一些描述信息,用来组织页与页之间的关联,通过页头所携带的信息可以快速寻找到上下页

页尾主要符合数据校验,确保数据的完整性

页主体:

数据页头:

用来描述当前页主体的状态,例如用户数据行数,空闲区,页目录的位置,事务索引有关信息
首行末行:

页主体初始化时就有了首行和末行,它们分别代表用户数据区的开始和结束
空闲区: 页主体中还未被使用的区域,可以被新增的用户数据所覆盖
用户数据区: 区中的所有用户数据以行为单位组织,每一个数据行通过单项链表组织,数据行可以通过行中存储的下一行偏移量来访问下一行数据
页目录: Innodb会通过主键对数据进行排序处理便于二分查找,当数据量庞大时,页目录中为生成一个个槽slot结构,每一个槽管理一小段数据行集合,查询时先通过检索槽来缩小查找范围

区结构:

批量读取数据的场景难免遇到数据跨页的情况,一旦发生数据跨页,就需要进行磁盘IO,严重影响效率,但是好在跨页访问的数据页在大多数情况下临近的,因此MySQL定义了区的概念用来管理多张页,如果用户频繁的对某一个区中的页进行访问,索性就把整个区加载到内存中,之后访问区中的页就不需要访问磁盘了

组结构:

同样问题引入了组结构来管理区,解决数据访问跨区的问题

行结构:

真实的数据在表空间以数据⾏的形式存储,即每⼀条数据都对应着表中的⼀⾏
数据行结构如图所示

变长字段长度列表+null值列表+头信息属于数据行描述信息
主键值+tx_id+roll_ptr+列属于数据行数据信息

主键值是一定存在的,不论用户是否手动定义

如果表中定义了主键,则直接存储主键的值;

如果是复合主键会根据列定义的顺序依次排列在这⾥;

如果没有主键,会优先使⽤第⼀个不允许为NULL的 UNIQUE 唯⼀列作为主键;

如果既没有主键也没有唯⼀键,那么InnoDB会构建⼀个6字节的字段 DB_ROW_ID 作为⾏的唯⼀标识,存储在真实数据的头部

tx_id为页中数据行的id,是页中数据行的唯一标识符

roll_ptr保存数据行的上一个版本,用于事务回滚操作

头信息:

next_record 是下一行的地址偏移量,正是通过next_record行与行之间才能使用单链表级联

record_type

0表示普通数据行

1表示索引数据行

2表示首行

3表示尾行
heap_no

0表示首行

1表示尾行

插入的数据行heap_no从2开始自增
n_owned

用于记录槽中的行数

一个槽中只有最后一行数据需要写明n_owned的值
delete_mask

删除标记位,当删除数据行时先把当前位置标记为已删除,将上一行数据和下一行数据进行链接,做到逻辑上的删除操作,同时将需要删除的行next_record指向一个垃圾链表,在合适的时机服务端会对垃圾链表中的数据行进行统一的物理删除

相关推荐
2401_889884663 分钟前
使用Pandas进行数据分析:从数据清洗到可视化
jvm·数据库·python
李宥小哥7 分钟前
SQLite04-表数据管理
java·jvm·数据库
Predestination王瀞潞16 分钟前
计科-计网8-计算题「整理」
网络·计算机网络·架构·智能路由器·计网
Smoothcloud_润云20 分钟前
GORM 事务管理与 Repository 模式完整指南
前端·数据库·代码规范
兆子龙20 分钟前
Turborepo 与 Monorepo 任务调度源码解析:从 DAG 到增量构建
前端·架构
未秃头的程序猿21 分钟前
深入理解MySQL三大日志:binlog、redo log、undo log,一文彻底搞懂!
mysql
aq553560021 分钟前
SQL 注入漏洞原理以及修复方法
网络·数据库·sql
刘晨鑫124 分钟前
LAMP网站架构与部署
架构
tiantian_cool24 分钟前
从零到一构建临床文献智能研究Agent(一):项目介绍与环境搭建
架构
兆子龙26 分钟前
Node.js 事件循环与 libuv 源码剖析:从 V8 到多线程 I/O
后端·架构