【innodb阅读笔记】之 CHAR 的行结构存储

通常理解 varchar 是存储变长长度的字符类型,char 是存储固定长度的字符类型,在使用单字节 latin1 字符集的时候,可以发现每行的变长字段长度的列表都没有存储 char 类型的长度,如:

sql 复制代码
# 创建表结构
CREATE TABLE `mytest1` (
  `t1` char(10) NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=latin1 ROW_FORMAT=DYNAMIC

# 插入数据
insert into mytest1 select 'aaa';

# 打开 mytest1.ibd 文件,整理二进制文件数据
00 00 10 ff f3
00 00 00 00 04 13
00 00 00 00 0b 29
a2 00 00 01 15 01 10
61 61 61 20 20 20 20 20 20 20
# 我们发现 char 类型 用 20 来填充, 同时没有变长字段列表

然而,从 MySQL 4.1 版本开始,char(N) 中 N 指的是字符的长度,而不是字节的长度,也就是说在不同的字符集下,char 类型内部存储的可能不是定长的数据,如:

sql 复制代码
# 创建表结构
CREATE TABLE `mytest2` (
  `t1` char(10) NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=gbk ROW_FORMAT=DYNAMIC

# 插入语句
insert into mytest2 select 'abc';
insert into mytest2 select '我们';

# 在当前例子上,表 mytest2 的字符集是 gbk ,然后我们查看所占字节,
mysql> select t1,char_length(t1),length(t1) from mytest2 \G;
*************************** 1. row ***************************
             t1: abc
char_length(t1): 3
     length(t1): 3
*************************** 2. row ***************************
             t1: 我们
char_length(t1): 3
     length(t1): 6
2 rows in set (0.00 sec)

# 'abc' 占用 3 个字节,而我们长度为 3 占用了 6 个字节,
# 使用 hex 函数查看内部二进制数据 
mysql> select t1,hex(t1) from mytest2 \G;
*************************** 1. row ***************************
     t1: abc
hex(t1): 616263
*************************** 2. row ***************************
     t1: 我们
hex(t1): E68891E4BBAC
2 rows in set (0.00 sec)
# 因此,对于多字码的字符编码,char不再代表固定长度的字符串了

# 查询 mytest2.ibd 二进制可以发现 

# abc 数据行 
0a        # 变长字段长度为10,将 char 视为 变长字段类型
00 00 10 00 23
00 00 00 00 04 14
00 00 00 00 0b 2b
a4 00 00 01 18 01 10
61 62 63 00 00 00 00 00 00 00 # abc 具体数据

# 我们 数据行
0a        # 变长字段长度为10,将 char 视为 变长字段类型
00 00 18 ff fc
00 00 00 00 04 15
00 00 00 00 0b 2c
a5 00 00 01 19 01 10
e6 88 91 e4 bb ac 20 20 20 20 # 我们 具体数据

上述例子清楚的显示了 Innodb 存储引擎内部对 char 类型在多字节字符集类型的存储,char 被明确视为变长字符类型,对于未能占用满长度的字符还是用 0x20 填充。因此,在多字节字符集的情况下,char 和 varchar 的实际行存储基本是没有区别的。

相关推荐
东方芷兰4 分钟前
LLM 笔记 —— 07 Tokenizers(BPE、WordPeice、SentencePiece、Unigram)
人工智能·笔记·深度学习·神经网络·语言模型·自然语言处理·nlp
不会kao代码的小王12 分钟前
从本地到云端:Fiora+cpolar打造真正的私密社交通讯站
笔记
fanstering17 分钟前
深度相机初探:立体视觉(Stereo Vision)、结构光(Structured Light)、TOF(Time of Flight,飞行时间)
笔记·数码相机·立体视觉·结构光·tof
长沙红胖子Qt21 分钟前
FFmpeg开发笔记(十三):ffmpeg采集麦克风音频pcm重采样为aac录音为AAC文件
笔记·ffmpeg·音视频
酌量25 分钟前
路径平滑优化详解(二次规划): 数学建模与目标函数推导
经验分享·笔记·学习·机器人·自动驾驶
泽虞28 分钟前
《Qt应用开发》笔记p3
linux·开发语言·数据库·c++·笔记·qt·面试
泽虞1 小时前
《Qt应用开发》笔记p4
linux·开发语言·数据库·c++·笔记·qt·算法
泽虞1 小时前
《Qt应用开发》笔记p5
linux·开发语言·c++·笔记·qt·算法
hour_go2 小时前
页表 vs. 组相联缓存:内存管理与性能优化的殊途同归
笔记·操作系统·分页·计算机体系结构·tlb·组相联缓存
superlls7 小时前
(微服务)Dubbo 服务调用
笔记·rpc·dubbo