在《详解MySQL两种存储引擎MyISAM和InnoDB的区别与优缺点》这篇文章中,我们对比了MyISAM和InnoDB两个存储引擎,这篇文章更深层次的讲解一下InnoDB的逻辑存储结构都包含哪些部分,每一部分都是什么功能,以及它们之间的层级关系。
整体结构
InnoDB存储引擎的逻辑结构是一个层次化的体系,主要由表空间、段、区、页、行(Row)构成。如下图所示。

根据这张图,我们逐步讲解一下整个层次结构中每个部分的定义与特征。
表空间
表空间是InnoDB数据的最高层容器,所有数据逻辑上都存储在表空间中。
InnoDB默认会创建一个共享表空间(通常是ibdata文件),同时支持独立表空间(file-per-table模式,每个表一个单独的文件)。
表空间负责数据的整体存储和管理,是InnoDB存储结构的核心。
段(Segment)
段是表空间的重要组成部分,用于存储不同类型的数据,逻辑上可分为数据段、索引段、回滚段等。
数据段用于存储表的记录,索引段用于管理表的索引,而回滚段用于事务回滚机制。
段是逻辑上的概念,InnoDB通过高效的算法管理这些段,以确保数据访问性能和空间利用率。
区(Extent)
区是段中的一个组成部分,由连续的页构成,且区的大小通常固定为1MB(基于默认页大小16KB)。每个区包含64个连续的页(64 × 16KB = 1MB)。如果页大小不是默认值(如设置为8KB或4KB),区大小会随之调整。
在段的初始阶段,InnoDB会使用32个碎片页以支持非连续存储,这对小表或初始数据的写入非常友好,可以优化段在小表上的空间利用率。与此同时,随着数据量增加,InnoDB会逐步使用更多连续页提升空间分配的效率。
区的分配是动态进行的,InnoDB会根据需求从表空间中申请新的区,以避免一次性占用大量磁盘空间。
页(Page)
页是InnoDB磁盘管理的最小单位,也被称为块。默认情况下,页的大小为16KB,但可以通过参数 innodb_page_size(如8KB、16KB、32KB)进行配置。
页的种类繁多,包含以下主要类型:
- 数据页:存储表的记录。
- Undo页:存储事务回滚信息。
- 系统页:存储元数据信息。
- 索引页:存储索引数据。
- 插入缓冲位图页、事务相关页等:承担更细粒度的存储管理任务。
页的结构复杂且功能强大,是InnoDB在存储引擎层面实现高效数据管理的关键组成部分。
行(Row)
行是InnoDB存储引擎中存储数据的最基本单元,一张表中的每一条记录就是一个数据行。在InnoDB中,数据行的存储方式支持两种格式:Compact 和Redundant,默认采用的是Compact格式。每一行由主键及其相关的字段数据组成,同时行记录中还包含行记录的元信息(例如标记位和事务ID等)。
数据行会存储到页中,通常一个页可以容纳多行数据,其实际存储量取决于页的大小以及行记录的长度。如果单个行记录过大,可能需要使用溢出页来存储超出的部分,例如非常大的BLOB或TEXT字段会存储在页之外,通过一个指针引用。
行的存储还遵循聚簇表的特性,即InnoDB基于主键顺序将数据行存放到页中。没有指定主键的表会自动创建一个隐藏主键(6字节的伪主键)。这一特性使得基于主键的查询性能非常高,同时记录之间的物理顺序和主键顺序保持一致。
InnoDB还通过行级锁来管理事务并发,保证数据的隔离性和一致性,这使得它特别适合支持高并发的在线事务处理场景(OLTP)。
小结
综上,InnoDB存储引擎通过表空间、段、区、页、行的层次化结构,实现了数据的高效存储和管理,同时提供了灵活的动态分配机制,支持不同场景下的性能优化和空间利用率。学习InnoDB的存储结构,也是学习其他理论知识的基础之一。