【MySQL】InnoDB记录存储结构
- 1.InnoDB页介绍
- [2. InnoDB行格式](#2. InnoDB行格式)
-
- [2.1 指定行格式的语法](#2.1 指定行格式的语法)
- [2.2 COMPACT 行格式](#2.2 COMPACT 行格式)
1.InnoDB页介绍
InnoDB 是一个将表中的数据存储到磁盘上的存储引擎,即使我们关闭并重启服务器,数据还是存在。而真正处理数据的过程发生在内存中,所以需要把磁盘中的数据加载到内存中。
如果是处理写入或修改请求,还需要把内存中的内容刷新到磁盘上。而我们知道读写磁盘的速度非常慢,与读写内存差了几个数量级。当我们想从表中获取某些记录时,InnoDB 存储引擎需要一条一条地把记录从磁盘上读出来么?不,那样会慢死,InnoDB 采取的方式是,将数据划分为若干个页,以页作为磁盘和内存之间交互的基本单位。InnoDB 中页的大小一般为 16KB。也就是在一般情况下,一次最少从磁盘中读取16KB的内容到内存中,一次最少把内存中的16KB 内容刷新到磁盘中。

2. InnoDB行格式
我们平时都是以记录为单位向表中插入数据的,这些记录在磁盘上的存放形式也被称为行格式或者记录格式。设计 InnoDB 存储引擎的大叔到现在为止设计了4种不同类型的行格話分别是 COMPACT、 REDUNDANT、 DYNAMIC 和 COMPRESSED。随着时间的推移,他们可能会设计出更多的行格式,但是不管怎么变,这些行格式在原理上大体都是相同的。
2.1 指定行格式的语法
我们可以在创建或修改表的语句中指定记录所使用的行格式:
CREATE TABLE 表名(列的信息)ROW_FORMAT=行格式名称;
ALTER TABLE 表名 ROW_FORMAT=行格式名称;
比如在 xiaohaizi 数据库中创建一个演示用的表 record_format_demo,可以这样指定它的行格式:

可以看到,我们刚刚创建的这个表的行格式就是COMPACT。另外,我们还显式指定了这个表的字符集为 ascii。因为 ascii 字符集只包括空格、标点符号、数字、大小写字母和一些不可见字符,所以汉字是不能存到这个表里的。向这个表中插入两条记录:

现在来看看各个行格式下的存储结构到底有啥不同。
2.2 COMPACT 行格式

从图4-1中可以看出,一条完整的记录其实可以被分为记录的额外信息和记录的真实数据两大部分。下面我们分别看一下这两大部分的组成。
1.记录额外信息
这部分信息是服务器为了更好地管理记录而不得不额外添加的一些信息。这些额外信息分为3个部分,分别是变长字段长度列表、NULL 值列表和记录头信息。
(1)变长字段长度列表
我们知道,MySQL 支持一些变长的数据类型,比如 VARCHAR(M)、 VARBINARY(M)、 各种 TEXT 类型、各种 BLOB 类型。我们也可以把拥有这些数据类型的列称为变长字段。变长字段中存储多少字节的数据是不固定的,所以我们在存储真实数据的时候需要顺便把这些数据占用的字节数也存起来,这样才不至于把 MySQL服务器搞懵。也就是说这些变长字段占用的存储空间分为两部分:
- 真正的数据内容;
- 该数据占用的字节数。