【innodb阅读笔记】之 CHAR 的行结构存储

通常理解 varchar 是存储变长长度的字符类型,char 是存储固定长度的字符类型,在使用单字节 latin1 字符集的时候,可以发现每行的变长字段长度的列表都没有存储 char 类型的长度,如:

sql 复制代码
# 创建表结构
CREATE TABLE `mytest1` (
  `t1` char(10) NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=latin1 ROW_FORMAT=DYNAMIC

# 插入数据
insert into mytest1 select 'aaa';

# 打开 mytest1.ibd 文件,整理二进制文件数据
00 00 10 ff f3
00 00 00 00 04 13
00 00 00 00 0b 29
a2 00 00 01 15 01 10
61 61 61 20 20 20 20 20 20 20
# 我们发现 char 类型 用 20 来填充, 同时没有变长字段列表

然而,从 MySQL 4.1 版本开始,char(N) 中 N 指的是字符的长度,而不是字节的长度,也就是说在不同的字符集下,char 类型内部存储的可能不是定长的数据,如:

sql 复制代码
# 创建表结构
CREATE TABLE `mytest2` (
  `t1` char(10) NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=gbk ROW_FORMAT=DYNAMIC

# 插入语句
insert into mytest2 select 'abc';
insert into mytest2 select '我们';

# 在当前例子上,表 mytest2 的字符集是 gbk ,然后我们查看所占字节,
mysql> select t1,char_length(t1),length(t1) from mytest2 \G;
*************************** 1. row ***************************
             t1: abc
char_length(t1): 3
     length(t1): 3
*************************** 2. row ***************************
             t1: 我们
char_length(t1): 3
     length(t1): 6
2 rows in set (0.00 sec)

# 'abc' 占用 3 个字节,而我们长度为 3 占用了 6 个字节,
# 使用 hex 函数查看内部二进制数据 
mysql> select t1,hex(t1) from mytest2 \G;
*************************** 1. row ***************************
     t1: abc
hex(t1): 616263
*************************** 2. row ***************************
     t1: 我们
hex(t1): E68891E4BBAC
2 rows in set (0.00 sec)
# 因此,对于多字码的字符编码,char不再代表固定长度的字符串了

# 查询 mytest2.ibd 二进制可以发现 

# abc 数据行 
0a        # 变长字段长度为10,将 char 视为 变长字段类型
00 00 10 00 23
00 00 00 00 04 14
00 00 00 00 0b 2b
a4 00 00 01 18 01 10
61 62 63 00 00 00 00 00 00 00 # abc 具体数据

# 我们 数据行
0a        # 变长字段长度为10,将 char 视为 变长字段类型
00 00 18 ff fc
00 00 00 00 04 15
00 00 00 00 0b 2c
a5 00 00 01 19 01 10
e6 88 91 e4 bb ac 20 20 20 20 # 我们 具体数据

上述例子清楚的显示了 Innodb 存储引擎内部对 char 类型在多字节字符集类型的存储,char 被明确视为变长字符类型,对于未能占用满长度的字符还是用 0x20 填充。因此,在多字节字符集的情况下,char 和 varchar 的实际行存储基本是没有区别的。

相关推荐
monkeyhlj7 分钟前
AI Agent开发课程笔记记录 - 提升篇 About RAG
人工智能·笔记
苦 涩10 分钟前
考研408笔记之操作系统(三)——内存管理
笔记·操作系统·考研408
SunAqua33 分钟前
《MCU与DSP芯片笔记》一、DSP芯片TI C2000系列TMS320F28035
笔记·单片机·嵌入式硬件
白夜111738 分钟前
C++(mixins 混入模式)
开发语言·c++·笔记
苦 涩1 小时前
考研408笔记之操作系统(二)——进程与线程
笔记·操作系统·考研408
苦 涩1 小时前
考研408笔记之操作系统(一)——计算机系统概述
笔记·操作系统·考研408
三品吉他手会点灯1 小时前
C语言学习笔记 - 16.C编程预备计算机专业知识 - Hello World程序的运行原理
c语言·笔记·学习
Amazing_Cacao1 小时前
CFCA精品可可工艺师认证课程初级校准:破解机器黑盒,实现物理参数与最终风味的精准对齐
笔记
所愿ღ1 小时前
SSM框架-Spring1
java·开发语言·笔记·spring
其实防守也摸鱼1 小时前
计算机组成原理--5.输入/输出(I/O)系统
服务器·笔记·深度学习·计算机网络·知识图谱·工具·计算机组成原理