【innodb阅读笔记】之 CHAR 的行结构存储

通常理解 varchar 是存储变长长度的字符类型,char 是存储固定长度的字符类型,在使用单字节 latin1 字符集的时候,可以发现每行的变长字段长度的列表都没有存储 char 类型的长度,如:

sql 复制代码
# 创建表结构
CREATE TABLE `mytest1` (
  `t1` char(10) NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=latin1 ROW_FORMAT=DYNAMIC

# 插入数据
insert into mytest1 select 'aaa';

# 打开 mytest1.ibd 文件,整理二进制文件数据
00 00 10 ff f3
00 00 00 00 04 13
00 00 00 00 0b 29
a2 00 00 01 15 01 10
61 61 61 20 20 20 20 20 20 20
# 我们发现 char 类型 用 20 来填充, 同时没有变长字段列表

然而,从 MySQL 4.1 版本开始,char(N) 中 N 指的是字符的长度,而不是字节的长度,也就是说在不同的字符集下,char 类型内部存储的可能不是定长的数据,如:

sql 复制代码
# 创建表结构
CREATE TABLE `mytest2` (
  `t1` char(10) NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=gbk ROW_FORMAT=DYNAMIC

# 插入语句
insert into mytest2 select 'abc';
insert into mytest2 select '我们';

# 在当前例子上,表 mytest2 的字符集是 gbk ,然后我们查看所占字节,
mysql> select t1,char_length(t1),length(t1) from mytest2 \G;
*************************** 1. row ***************************
             t1: abc
char_length(t1): 3
     length(t1): 3
*************************** 2. row ***************************
             t1: 我们
char_length(t1): 3
     length(t1): 6
2 rows in set (0.00 sec)

# 'abc' 占用 3 个字节,而我们长度为 3 占用了 6 个字节,
# 使用 hex 函数查看内部二进制数据 
mysql> select t1,hex(t1) from mytest2 \G;
*************************** 1. row ***************************
     t1: abc
hex(t1): 616263
*************************** 2. row ***************************
     t1: 我们
hex(t1): E68891E4BBAC
2 rows in set (0.00 sec)
# 因此,对于多字码的字符编码,char不再代表固定长度的字符串了

# 查询 mytest2.ibd 二进制可以发现 

# abc 数据行 
0a        # 变长字段长度为10,将 char 视为 变长字段类型
00 00 10 00 23
00 00 00 00 04 14
00 00 00 00 0b 2b
a4 00 00 01 18 01 10
61 62 63 00 00 00 00 00 00 00 # abc 具体数据

# 我们 数据行
0a        # 变长字段长度为10,将 char 视为 变长字段类型
00 00 18 ff fc
00 00 00 00 04 15
00 00 00 00 0b 2c
a5 00 00 01 19 01 10
e6 88 91 e4 bb ac 20 20 20 20 # 我们 具体数据

上述例子清楚的显示了 Innodb 存储引擎内部对 char 类型在多字节字符集类型的存储,char 被明确视为变长字符类型,对于未能占用满长度的字符还是用 0x20 填充。因此,在多字节字符集的情况下,char 和 varchar 的实际行存储基本是没有区别的。

相关推荐
北岛寒沫14 分钟前
北京大学国家发展研究员 中国经济专题 课程笔记(第二课 农村土地改革)
经验分享·笔记·学习
Piccab0o38 分钟前
【学习笔记】——电磁相关
笔记·学习
WangJunXiang61 小时前
nginx安全笔记
笔记·nginx·安全
不只会拍照的程序猿2 小时前
《嵌入式AI筑基笔记02:Python数据类型02,从C的“硬核”到Python的“包容”》
开发语言·笔记·python
早睡早起好好code2 小时前
Qwen2.5-VL研究_待完善...
图像处理·人工智能·笔记·深度学习·学习
_muffinman2 小时前
LED点阵8*8驱动开发笔记(Ai8051U单片机)
驱动开发·笔记·单片机
Wyawsl2 小时前
Nginx性能优化与监控笔记
笔记·nginx·性能优化
xiaokangzhe2 小时前
nginx安全笔记
笔记·nginx·安全
-Springer-2 小时前
STM32 学习 —— 个人学习笔记9-1(USART串口协议 & 串口发送及接收数据)
笔记·stm32·学习