MySQL数据类型

数据类型分类

数据类型一共可以分为四大类,其大致与C语言、C++大致类似,其详细如图所示:

数据类型

最常用的数值类型便是如下:

tinyint类型

其数值的范围为:[-128, 127],如果在数据库的使用过程中插入的tinyint类型的值超过该范围,数据库便会自己发生报错,从而插入失败。

除此之外需要说明的就是:

  • 在MySQL中,整型可以指定是有符号的和无符号的,默认是有符号的。
  • 可以通过UNSIGNED来说明某个字段是无符号的

无符号案例

可以从图中看到,将tinyint设置为无符号类型后,其范围会从原本的 [-128, 127] 变为 [0, 225] ,其范围的计算方式便是将负数的部分全部给与正数。

以此方法便可以推导出别的类型的无符号类型的范围。

需要注意的是:尽量不使用unsigned,对于int类型可能存放不下的数据,int unsigned同样可能存放不下,与其如此,还不如设计时,将int类型提升为bigint类型。

bit类型

语法:

复制代码
bit[(M)] : 位字段类型。M表示每个值的位数,范围从1到64。如果M被忽略,默认为1。

举例:

可以看到bit类型中,虽然我插入的是10,但是其显示的确实16进制的10。其原因是归结于ASCII表,在不同的系统中显示的方式略有不同,如果为centos系统会以ASCII码值显示,对应图中便是换行符,便是看到空白。

所以

  • bit字段在显示时,是按照ASCII码对应的值显示。
  • 如果我们有这样的值,只存放0或1,这时可以定义bit(1)。这样可以节省空间。

小数类型

float

语法:

复制代码
float[(m, d)] [unsigned] : M指定显示长度,d指定小数位数,占用空间4个字节。

案例:

小数:float(4,2)表示的范围是-99.99 ~ 99.99,MySQL在保存值时会进行四舍五入。

如果我们将float设置为unsigned的化,就会将浮点数设置为无浮点数,这时候就会舍弃负数部分,将范围变为 [0,99.99]。

decimal

语法:

复制代码
decimal(m, d) [unsigned] : 定点数m指定长度,d表示小数点的位数。
  • decimal的范围为:[-999.99,999.99]
  • decimal(5,2) unsigned 表示的范围 [0,999.99]
  • decimal与float的区别就类似于C语言中float于double的区别,其很像,但还是有区别的。
  • 其decimal和float的精度不同。

发现decimal的精度更准确,因此如果我们希望某个数据表示高精度时,就要选用decimal。但高精度也需要更多的存储资源。

  • float表示的精度大约是7位。
  • decimal整数最大位数m为65。支持小数最大位数d是30。如果d被省略,默认为0.如果m被省略,默认是10。

字符串类型

char

语法:

复制代码
char(L): 固定长度字符串,L是可以存储的长度,单位为字符,最大长度值可以为255。

案例:

说明:

char(2) 表示可以存放两个字符,可以是字母或汉字,但是不能超过2个,最多只能是255。

varchar

语法:

复制代码
varchar(L): 可变长度字符串,L表示字符长度,最大长度65535个字节。

说明:

  • 关于varchar(len),len到底是多少,这个len值,和表的编码密切相关。
  • varchar长度可以指定为0到65535之间的值,但是会有 1 ~ 3个字节用于记录数据大小,所以说有效字节数是65532。
  • 当我们的表的编码是utf8时,varchar(n)的参数n最大值是65532/3=21844[因为utf中,一个字符占用3个字节],如果编码是gbk,varchar(n)的参数n最大是65532/2=32766(因为gbk中,一个字符占用2字节)。

char和varchar比较

如何选择定长或变长字符串?

  • 如果数据确定长度都一样,就使用定长(char),比如:身份证,手机号,md5。
  • 如果数据长度有变化,就使用变长(varchar),比如:名字,地址,但是你要保证最长的能存的进去。
  • 定长的磁盘空间比较浪费,但是效率高。
  • 变长的磁盘空间比较节省,但是效率低。
  • 定长的意义是,直接开辟好对应的空间。
  • 变长的意义是,在不超过自定义范围的情况下,用多少,开辟多少。

日期和时间类型

常用的日期有如下三个:

  • date:日期 'yyyy-mm-dd' ,占用三字节。
  • datetime:时间日期格式 'yyyy-mm-dd HH:ii:ss' 表示范围从 1000 到 9999 ,占用八字节。
  • timestamp:时间戳,从1970年开始的 yyyy-mm-dd HH:ii:ss 格式和 datetime 完全一致,占用四字节。

需要提醒的是,日期和时间类型都是有格式的,插入的时候也要符合格式要求式的插入。

enum和set

语法:

复制代码
enum('选项1','选项2','选项3',...);
set('选项值1','选项值2','选项值3', ...);
  • enum为枚举,其设定是提供了若干个选项的值,最终在一个单元格中,实际只存储了其中的一个值。而且出于效率考虑,这些值在实际上是以数字形式存储的。因为这些选项的每个选项值依次对应如下数字:1,2,3,....最多65535个。当我们添加枚举值时,也可以添加对应的数字编号。
  • set为集合,其设定只是提供了若干个选项的值,最终一个单元格中,设计可存储了其中任意多个值;而且出于效率考虑,这些值实际存储的是"数字",因为这些选项的每个选项值依次对应如下数字:1,2,4,8,16,32,.... 最多64个。

但是不建议添加枚举值、集合值的时候采用数字的方式,因为不利于阅读。

为何set的选项值对应数字为1,2,4,8......

其是因为set的每个值分别对应的是二进制的每一位,选项1对应的是第一位,也就是1,选项2对应的是第二位,也就是2,选项3对应的是第三位,也就是4......

因此如果我们选择哪一个选项,二进制中的那位就会设为1。多选也就是将多个对应的位设置为1。值为3,即选择选项1、2。以此类推。

集合查询使用find_ in_ set函数

但如果我们要查询即选择选项1,有选择选项2时,如果查询值为3的,那么这种方法显然是低效的。这时候就需要使用find_in_set函数

find_in_set(sub,str_list):如果 sub 在 str_list 中,则返回下标。如果不在,返回0。str_list 用逗号分隔的字符串。

相关推荐
AI前沿晓猛哥1 小时前
c盘太满了,如何清理 专业工具深度扫描注册表残留与文件垃圾安全吗
数据挖掘
二年级程序员1 小时前
一篇文章掌握“树”(上)
c语言·数据结构·算法
安全不再安全2 小时前
某驱动任意读漏洞分析 - 可用于游戏内存数据读取
c语言·测试工具·安全·游戏·网络安全
MMME~2 小时前
HAProxy:高性能负载均衡实战指南
linux·运维·数据库
hans汉斯2 小时前
《数据挖掘》期刊推介&征稿指南
图像处理·人工智能·算法·yolo·数据挖掘·超分辨率重建·汉斯出版社
難釋懷2 小时前
基于Redis的Stream结构作为消息队列,实现异步秒杀下单
数据库·redis·缓存
TDengine (老段)2 小时前
TDengine IDMP 数据可视化——状态时间线
大数据·数据库·ai·信息可视化·时序数据库·tdengine·涛思数据
DolphinDB智臾科技2 小时前
V3.00.5 & 2.00.18 更新!TPC-H 性能跃升,MPP 引擎来了…
大数据·数据库·时序数据库·dolphindb
xing-xing2 小时前
Spring Data项目
数据库·spring