一、数据类型分类
二、数值类型
1、tinyint 类型
在 MySQL 中,整型可以指定是有符号的和无符号的,默认是有符号的。
有符号:
插入数据越界测试:
在 MySQL 表中建立属性列时,我们可以发现列名称在前,类型在后。
比如:num tinyint (unsigned)
无符号(unsigned):
可以通过 unsigned 来说明某个字段是无符号的。
插入数据越界测试:
char a = 1234567;
- C/C++ 中,编译器不会报错,最多也就是报警,这里会发生截断 ,甚至发生隐式转换。
- MySQL 中,在特定的类型中插入不合法的数据,一般会发生拦截,不让我们做对应的操作。
反过来,如果已经有数据被成功插入到 MySQL 中,那么说明插入时一定是合法的。
所以,在 MySQL 中,一般而言,数据类型本身也是一种约束。
(能够保证数据库中的数据是可预期、完整的)
注意 :尽量不使用 unsigned,对于 int 类型可能存放不下的数据,int unsigned 同样可能存放不下,与其如此,还不如在设计时,将 int 类型提升为 bigint 类型。
2、bit 类型
cpp
bit[(M)] : 位字段类型。M表示每个值的位数,范围:1~64。如果M被忽略,默认为1
插入数据越界测试:
为什么下图中的 online 列没有显示内容?
因为 online 是位类型,在显示 0/1 时,是按照 ASCII 码值显示的。只不过当前显示的 ASCII 码值是不可显示的。
如果想在 online 列显示内容,可以输入 select id, hex(online) from t3;(让 online 按照十进制方案插入位结构)
修改 online 的 bit 位:
插入成功:
bit 字段在显示时,是按照 ASCII 码对应的值显示。
如果我们有这样的值,只存放 0/1,这时可以定义 bit(1),可以节省空间。
3、小数类型
(1)float
cpp
float[(m, d)] [unsigned] : M指定显示长度,d指定小数位数,占用空间4个字节
插入数据越界测试:
小数:float(4,2) 表示的范围是 -99.99~99.99,默认是有符号浮点数。
MySQL 在保存值时会进行四舍五入。
注意:在合法范围内允许五入,但在边界值五入会导致整体的浮点数增多,从而超过浮点数对应的范围,所以不是所有情况都可以五入。
unsigned:
如果定义的是 float(4,2) unsigned 这时,因为把它指定为无符号的数,范围是 0~99.99(相当于有符号浮点数删减去负数取值部分)。
插入数据越界测试:
整数部分也可能有精度损失。
(2)decimal
cpp
decimal(m, d) [unsigned] : 定点数m指定长度,d表示小数点的位数
- decimal(5,2) 表示的范围是 -999.99 ~ 999.99
- decimal(5,2) unsigned 表示的范围 0 ~ 999.99
插入数据越界测试:
decimal 和 float 的区别:
float 和 decimal 表示的精度不一样。
- float 表示的精度大约是 7 位。(会发生截断或四舍五入)
- decimal 整数最大位数 m 为 65。支持小数最大位数 d 是 30。如果 d 被省略,默认为 0。如果 m 被省略,默认是 10。(完全保证精度准确)
建议如果希望小数的精度高,推荐使用 decimal。
三、字符串类型
1、char
cpp
char(L): 固定长度字符串,L是可以存储的长度,单位为字符,最大长度值可以为255
char(2) 表示可以存放两个字符,可以是字母或汉字,但是不能超过 2 个, 最多只能是 255。
插入数据越界测试:
- 在 utf-8 中一个汉字一般占 3 个字节,在 gbk 中一个汉字一般占 2 个字节。
注意:char 类型的单位为字符,MySQL 中的字符和 C/C++ 中的字符概念同,语言上的字符是一个字符对应一个字节,而这里的一个字符就是代表一个符号。
2、varchar
cpp
varchar(L): 可变长度字符串,L表示字符长度,最大长度65535个字节
插入数据越界测试:
varchar 长度可以指定为 0~ 65535 之间的值,但是有 1~3 个字节用于记录数据大小,所以说有效字节数是 65532。
- 当我们的表的编码是utf-8 时,varchar(n) 的参数 n 最大值是 65532/3=21844(因为在 utf 中,一个字符占用 3 个字节)。
- 如果编码是gbk,varchar(n) 的参数 n 最大是 65532/2=32766(因为 gbk 中,一个字符占用 2 字节)。
3、char 和 varchar 比较
如何选择定长或变长字符串?
- 如果数据确定长度都一样,就使用定长(char),比如:身份证、手机号、md5。
- 如果数据长度有变化,就使用变长(varchar),比如:名字、地址,但你要保证最长的能够存的进去。
- 定长的磁盘空间比较浪费,但效率高。
- 变长的磁盘空间比较节省,但效率低。
- 定长的意义:直接开辟好对应的空间
- 变长的意义:在不超过自定义范围的情况下,用多少就开辟多少。
四、日期和时间类型
1、date
date 日期格式:'yyyy-mm-dd',占用 3 字节。
2、datetime
datetime 时间日期格式:'yyyy-mm-dd HH:ii:ss' 表示范围为 1000~9999 ,占用 8 字节。
3、timestamp
timestamp 时间戳会自动更新,从 1970 年开始的 yyyy-mm-dd HH:ii:ss 格式和 datetime 完全一致,占用 4 字节。
五、enum 和 set
插入数据越界测试:
1、enum
- enum:枚举,"单选" 类型;
- enum('选项1', '选项2', '选项3',...);
该设定只是提供了若干个选项的值,最终一个单元格中,实际只存储了其中一个值;而且出于效率考虑,这些值实际存储的是 "数字",因为这些选项的每个选项值依次对应如下数字:1,2,3,... 最多 65535 个(从 1 开始);当我们添加枚举值时,也可以添加对应的数字编号。
2、set
- set:集合,"多选" 类型;
- set('选项值1', '选项值2', '选项值3', ...);
该设定只是提供了若干个选项的值,最终一个单元格中,设计可存储了其中任意多个值;而且出于效率考虑,这些值实际存储的是 " 数字 " ,因为这些选项的每个选项值依次对应如下数字: 1,2,4,8,16,32 , ... 最多 64 个。
1 对应的就是 '选项值1',2 对应的是 '选项值2',3 对应的是 '选项值1,选项值2'...跟二进制比特位的计数有关。 比特位由低到高依次对应的是选项值从左向右。
说明:不建议在添加枚举值,集合值的时候采用数字的方式,因为不利于阅读。
3、集合查询使用 find_ in_ set 函数
find_in_set(sub, str_list) :
- 如果 sub 在 str_list 中,则返回下标;
- 如果不在,返回 0; str_list 用逗号分隔的字符串。