MySQL数据类型 - 技术栈

数据类型分类

数据类型一共可以分为四大类，其大致与C语言、C++大致类似，其详细如图所示：

数据类型

最常用的数值类型便是如下：

tinyint类型

其数值的范围为： $-128, 127$ ，如果在数据库的使用过程中插入的tinyint类型的值超过该范围，数据库便会自己发生报错，从而插入失败。

除此之外需要说明的就是：

在MySQL中，整型可以指定是有符号的和无符号的，默认是有符号的。
可以通过UNSIGNED来说明某个字段是无符号的

无符号案例

可以从图中看到，将tinyint设置为无符号类型后，其范围会从原本的 $-128, 127$ 变为 $0, 225$ ，其范围的计算方式便是将负数的部分全部给与正数。

以此方法便可以推导出别的类型的无符号类型的范围。

需要注意的是：尽量不使用unsigned，对于int类型可能存放不下的数据，int unsigned同样可能存放不下，与其如此，还不如设计时，将int类型提升为bigint类型。

bit类型

语法：

复制代码

bit[(M)] : 位字段类型。M表示每个值的位数，范围从1到64。如果M被忽略，默认为1。

举例：

可以看到bit类型中，虽然我插入的是10，但是其显示的确实16进制的10。其原因是归结于ASCII表，在不同的系统中显示的方式略有不同，如果为centos系统会以ASCII码值显示，对应图中便是换行符，便是看到空白。

所以

bit字段在显示时，是按照ASCII码对应的值显示。
如果我们有这样的值，只存放0或1，这时可以定义bit(1)。这样可以节省空间。

小数类型

float

语法：

复制代码

float[(m, d)] [unsigned] : M指定显示长度，d指定小数位数，占用空间4个字节。

案例：

小数：float(4,2)表示的范围是-99.99 ~ 99.99，MySQL在保存值时会进行四舍五入。

如果我们将float设置为unsigned的化，就会将浮点数设置为无浮点数，这时候就会舍弃负数部分，将范围变为 $0，99.99$ 。

decimal

语法：

复制代码

decimal(m, d) [unsigned] : 定点数m指定长度，d表示小数点的位数。

decimal的范围为： $-999.99，999.99$
decimal(5,2) unsigned 表示的范围 $0，999.99$
decimal与float的区别就类似于C语言中float于double的区别，其很像，但还是有区别的。
其decimal和float的精度不同。

发现decimal的精度更准确，因此如果我们希望某个数据表示高精度时，就要选用decimal。但高精度也需要更多的存储资源。

float表示的精度大约是7位。
decimal整数最大位数m为65。支持小数最大位数d是30。如果d被省略，默认为0.如果m被省略，默认是10。

字符串类型

char

语法：

复制代码

char(L): 固定长度字符串，L是可以存储的长度，单位为字符，最大长度值可以为255。

案例：

说明：

char(2) 表示可以存放两个字符，可以是字母或汉字，但是不能超过2个，最多只能是255。

varchar

语法：

复制代码

varchar(L): 可变长度字符串，L表示字符长度，最大长度65535个字节。

说明：

关于varchar(len)，len到底是多少，这个len值，和表的编码密切相关。
varchar长度可以指定为0到65535之间的值，但是会有 1 ~ 3个字节用于记录数据大小，所以说有效字节数是65532。
当我们的表的编码是utf8时，varchar(n)的参数n最大值是65532/3=21844 $因为utf中，一个字符占用3个字节$ ，如果编码是gbk，varchar(n)的参数n最大是65532/2=32766（因为gbk中，一个字符占用2字节）。

char和varchar比较

如何选择定长或变长字符串？

如果数据确定长度都一样，就使用定长（char），比如：身份证，手机号，md5。
如果数据长度有变化,就使用变长(varchar)，比如：名字，地址，但是你要保证最长的能存的进去。
定长的磁盘空间比较浪费，但是效率高。
变长的磁盘空间比较节省，但是效率低。
定长的意义是，直接开辟好对应的空间。
变长的意义是，在不超过自定义范围的情况下，用多少，开辟多少。

日期和时间类型

常用的日期有如下三个：

date：日期 'yyyy-mm-dd' ，占用三字节。
datetime：时间日期格式 'yyyy-mm-dd HH:ii:ss' 表示范围从 1000 到 9999 ，占用八字节。
timestamp：时间戳，从1970年开始的 yyyy-mm-dd HH:ii:ss 格式和 datetime 完全一致，占用四字节。

需要提醒的是，日期和时间类型都是有格式的，插入的时候也要符合格式要求式的插入。

enum和set

语法：

复制代码

enum('选项1','选项2','选项3',...);
set('选项值1','选项值2','选项值3', ...);

enum为枚举，其设定是提供了若干个选项的值，最终在一个单元格中，实际只存储了其中的一个值。而且出于效率考虑，这些值在实际上是以数字形式存储的。因为这些选项的每个选项值依次对应如下数字：1,2,3,....最多65535个。当我们添加枚举值时，也可以添加对应的数字编号。
set为集合，其设定只是提供了若干个选项的值，最终一个单元格中，设计可存储了其中任意多个值；而且出于效率考虑，这些值实际存储的是"数字"，因为这些选项的每个选项值依次对应如下数字：1,2,4,8,16,32，.... 最多64个。

但是不建议添加枚举值、集合值的时候采用数字的方式，因为不利于阅读。

为何set的选项值对应数字为1，2，4，8......

其是因为set的每个值分别对应的是二进制的每一位，选项1对应的是第一位，也就是1，选项2对应的是第二位，也就是2，选项3对应的是第三位，也就是4......

因此如果我们选择哪一个选项，二进制中的那位就会设为1。多选也就是将多个对应的位设置为1。值为3，即选择选项1、2。以此类推。

集合查询使用find_ in_ set函数

但如果我们要查询即选择选项1，有选择选项2时，如果查询值为3的，那么这种方法显然是低效的。这时候就需要使用find_in_set函数

find_in_set(sub,str_list)：如果 sub 在 str_list 中，则返回下标。如果不在，返回0。str_list 用逗号分隔的字符串。