MySQL 数据类型核心指南:选型、实战与避坑


🔥草莓熊Lotso: 个人主页
❄️个人专栏: 《C++知识分享》 《Linux 入门到实践:零基础也能懂》
✨生活是默默的坚持,毅力是永久的享受!


🎬 博主简介:


文章目录

  • 前言:
  • [一. MySQL 数据类型分类总览](#一. MySQL 数据类型分类总览)
  • [二. 数值类型:精准匹配数字范围与精度](#二. 数值类型:精准匹配数字范围与精度)
    • [2.1 整数类型(BIT/TINYINT/INT/BIGINT)](#2.1 整数类型(BIT/TINYINT/INT/BIGINT))
      • [2.1.1 TINYINT 类型测试](#2.1.1 TINYINT 类型测试)
      • [2.1.2 BIT 类型测试](#2.1.2 BIT 类型测试)
      • [2.1.3 INT/BIGINT 对比测试](#2.1.3 INT/BIGINT 对比测试)
    • [2.2 小数类型(FLOAT/DOUBLE/DECIMAL)](#2.2 小数类型(FLOAT/DOUBLE/DECIMAL))
      • [2.2.1 FLOAT/DECIMAL 精度对比测试](#2.2.1 FLOAT/DECIMAL 精度对比测试)
      • [2.2.2 DECIMAL 范围测试](#2.2.2 DECIMAL 范围测试)
  • [三. 字符串类型:CHAR 与 VARCHAR 的终极选型](#三. 字符串类型:CHAR 与 VARCHAR 的终极选型)
    • [3.1 核心字符串类型对比](#3.1 核心字符串类型对比)
    • [3.2 CHAR 与 VARCHAR 深度测试](#3.2 CHAR 与 VARCHAR 深度测试)
    • [3.3 VARCHAR 长度限制测试](#3.3 VARCHAR 长度限制测试)
  • [四. 日期时间类型:DATE/DATETIME/TIMESTAMP 选型](#四. 日期时间类型:DATE/DATETIME/TIMESTAMP 选型)
    • [4.1 TIMESTAMP 自动更新测试](#4.1 TIMESTAMP 自动更新测试)
  • [五. 特殊字符串类型:ENUM 与 SET(单选 / 多选场景)](#五. 特殊字符串类型:ENUM 与 SET(单选 / 多选场景))
    • [5.1 ENUM(单选枚举)测试](#5.1 ENUM(单选枚举)测试)
    • [5.2 SET(多选集合)测试](#5.2 SET(多选集合)测试)
  • [六. 数据类型选型避坑指南和总结](#六. 数据类型选型避坑指南和总结)
  • 结尾:

前言:

在 MySQL 数据库设计中,数据类型的选择直接影响存储效率、查询性能和数据准确性。选对数据类型能避免存储空间浪费、数据溢出、精度丢失等问题,而选错则可能导致系统隐患(如用INT存储手机号导致截断)。本文将全面拆解 MySQL 核心数据类型,结合实战案例讲解选型技巧,帮你从 "能用" 升级到 "用好" 数据类型。


一. MySQL 数据类型分类总览

MySQL 的数据类型丰富,按功能可分为五大类,覆盖数值、字符串、日期、特殊类型等场景:

分类 核心类型 适用场景
数值类型 BIT、TINYINT、INT、BIGINT、FLOAT、DECIMAL 存储数字(年龄、金额、计数等)
字符串类型 CHAR、VARCHAR、TEXT、BLOB 存储文本(姓名、地址、大文本、二进制数据)
日期时间类型 DATE、DATETIME、TIMESTAMP 存储时间(生日、创建时间、时间戳)
特殊字符串 ENUM(枚举)、SET(集合) 固定选项(性别、爱好、状态等)
二进制类型 BLOB 存储图片、文件等二进制数据

二. 数值类型:精准匹配数字范围与精度

数值类型是最常用的类型,核心关注范围和精度,避免数据溢出或精度丢失。

2.1 整数类型(BIT/TINYINT/INT/BIGINT)

整数类型按占用字节和范围分为 5 类,支持UNSIGNED(无符号)修饰(默认有符号):

类型 占用字节 有符号范围 无符号范围 适用场景
BIT(M) 1-8 1-64 位(默认 1 位) 同有符号 存储 0/1(性别)、位掩码
TINYINT 1 -128 ~ 127 0 ~ 255 年龄、状态值(0-255)
SMALLINT 2 -32768 ~ 32767 0 ~ 65535 小范围计数(如订单编号)
INT 4 -2147483648 ~ 2147483647 0 ~ 4294967295 普通计数(如用户 ID)
BIGINT 8 -9e18 ~ 9e18 0 ~ 1.8e19 大数值(如手机号、雪花 ID)

关键实战要点

  • 避免无符号类型(UNSIGNED) :虽然无符号类型能扩大正数范围,但可能导致溢出时报错(如TINYINT UNSIGNED插入 - 1 直接报错),且与有符号类型计算时容易出现逻辑问题。建议直接用更大的整数类型(如用INT替代TINYINT UNSIGNED)。
  • BIT 类型的坑 :BIT 字段存储的是位数据,查询时会按 ASCII 码显示(如bit(8)存储 10 显示为换行符,存储 65 显示为 'A'),仅适合存储 0/1 等简单标识:
sql 复制代码
CREATE TABLE tt5(gender bit(1));
INSERT INTO tt5 VALUES(0); -- 成功
INSERT INTO tt5 VALUES(1); -- 成功
INSERT INTO tt5 VALUES(2); -- 越界报错(bit(1)仅支持0/1)

2.1.1 TINYINT 类型测试

TINYINT 占用 1 字节,有符号范围 - 128~127,无符号范围 0~255:

sql 复制代码
-- 1. 创建有符号TINYINT表
CREATE TABLE test_tinyint1(age TINYINT);

-- 2. 插入合法值
INSERT INTO test_tinyint1 VALUES(127); -- 成功(最大值)
INSERT INTO test_tinyint1 VALUES(-128); -- 成功(最小值)

-- 3. 插入越界值(报错)
INSERT INTO test_tinyint1 VALUES(128); 
-- 报错:Out of range value for column 'age' at row 1

-- 4. 创建无符号TINYINT表
CREATE TABLE test_tinyint2(age TINYINT UNSIGNED);

-- 5. 插入无符号合法值
INSERT INTO test_tinyint2 VALUES(255); -- 成功(无符号最大值)

-- 6. 插入负数(无符号越界报错)
INSERT INTO test_tinyint2 VALUES(-1); 
-- 报错:Out of range value for column 'age' at row 1

2.1.2 BIT 类型测试

BIT 存储位数据,默认 1 位(仅支持 0/1),位数 M 需≤64,查询时按 ASCII 码显示(易踩坑),但是我自己实际测试也有可能会是16进制的,大家可以自己去试试:

sql 复制代码
-- 1. 创建BIT(1)字段的表
CREATE TABLE test_bit(gender BIT(1));

-- 2. 插入合法值(0/1)
INSERT INTO test_bit VALUES(0); -- 成功
INSERT INTO test_bit VALUES(1); -- 成功

-- 3. 插入越界值(报错)
INSERT INTO test_bit VALUES(2); 
-- 报错:Data truncation: Data too long for column 'gender' at row 1

-- 4. 查询BIT字段(关键:直接查询显示ASCII字符,需转成数字)
SELECT gender, bin(gender+0) FROM test_bit;

运行结果

bash 复制代码
+--------+---------------+
| gender | bin(gender+0) |
+--------+---------------+
|       | 0             | -- 0的ASCII显示为空白,转数字后是0
|       | 1             | -- 1的ASCII显示为,转数字后是1
+--------+---------------+

2.1.3 INT/BIGINT 对比测试

sql 复制代码
-- 1. INT存储手机号(越界测试)
CREATE TABLE test_int(phone INT);
INSERT INTO test_int VALUES(13800138000); 
-- 报错:Out of range value for column 'phone' at row 1(INT最大值2147483647 < 13800138000)

-- 2. BIGINT存储手机号(成功)
CREATE TABLE test_bigint(phone BIGINT);
INSERT INTO test_bigint VALUES(13800138000); -- 成功
SELECT * FROM test_bigint;
+-------------+
| phone       |
+-------------+
| 13800138000 |
+-------------+

2.2 小数类型(FLOAT/DOUBLE/DECIMAL)

小数类型用于存储带小数点的数值,核心区别在于精度

以下是您需要的表格,已整理为清晰格式:

类型 占用字节 精度特性 适用场景
FLOAT 4 单精度,约 7 位有效数字 非精确计算(如身高、体重)
DOUBLE 8 双精度,约 15 位有效数字 较高精度计算(如温度)
DECIMAL 可变 高精度(自定义整数 + 小数位) 精确计算(如金额、税率)

2.2.1 FLOAT/DECIMAL 精度对比测试

sql 复制代码
-- 1. 创建小数测试表
CREATE TABLE test_decimal(
  salary_float FLOAT(10,8),
  salary_decimal DECIMAL(10,8)
);

-- 2. 插入相同数值
INSERT INTO test_decimal VALUES(23.12345612, 23.12345612);

-- 3. 查询结果(精度差异)
SELECT * FROM test_decimal;

运行结果:

sql 复制代码
+---------------+----------------+
| salary_float  | salary_decimal |
+---------------+----------------+
| 23.12345695   | 23.12345612    |
+---------------+----------------+
  • 发现decimal的精度更准确,因此如果我们希望某个数据表示高精度,选择decimal
  • 关键结论:FLOAT 是近似存储,存在精度丢失;DECIMAL 是精确存储,适合金额、税率等场景。
  • float表示的精度大约是7位,decimal整数最大位置m为65,支持小数最大位置d是30,如果d被省略,默认位0,如果m被省略,默认是10。建议如果希望小数的精度高,推荐使用decimal。

2.2.2 DECIMAL 范围测试

sql 复制代码
CREATE TABLE test_decimal2(price DECIMAL(5,2)); -- 总长度5,小数位2 → 范围-999.99~999.99

INSERT INTO test_decimal2 VALUES(999.99); -- 成功
INSERT INTO test_decimal2 VALUES(1000.00); -- 报错:Out of range value for column 'price' at row 1

三. 字符串类型:CHAR 与 VARCHAR 的终极选型

字符串类型是最容易用错的类型,核心是区分CHAR(固定长度)和VARCHAR(可变长度),以及TEXT(大文本)的适用场景。

3.1 核心字符串类型对比

以下是您需要的表格:

类型 长度限制 存储特性 适用场景
CHAR(L) L ≤ 255(字符) 固定长度,不足补空格 长度固定(身份证、手机号)
VARCHAR(L) L ≤ 65535(字节) 可变长度,存储实际长度 + 1-3 字节长度标识 长度不固定(姓名、地址)
TEXT 最大 65535 字节 大文本,不支持默认值 / 全文索引 长文本(文章内容、备注)
BLOB 最大 65535 字节 二进制存储 图片、文件等二进制数据

3.2 CHAR 与 VARCHAR 深度测试

sql 复制代码
-- 1. 创建CHAR/VARCHAR对比表(UTF8编码,1字符=3字节)
CREATE TABLE test_char_varchar(
  c_char CHAR(4),
  c_varchar VARCHAR(4)
) CHARSET=utf8;

-- 2. 插入不同长度数据
INSERT INTO test_char_varchar VALUES('abcd', 'abcd'); -- 4字符
INSERT INTO test_char_varchar VALUES('A', 'A'); -- 1字符
INSERT INTO test_char_varchar VALUES('中国', '中国'); -- 2字符

-- 3. 查询数据(查看实际存储)
SELECT 
  c_char, LENGTH(c_char), -- CHAR长度:固定12字节(4×3)
  c_varchar, LENGTH(c_varchar) -- VARCHAR长度:实际字符×3 + 1字节
FROM test_char_varchar;

运行结果

sql 复制代码
+--------+---------------+------------+------------------+
| c_char | LENGTH(c_char)| c_varchar  | LENGTH(c_varchar)|
+--------+---------------+------------+------------------+
| abcd   |            12 | abcd       |               13 |
| A      |            12 | A          |                4 |
| 中国   |             6 | 中国       |                7 |
+--------+---------------+------------+------------------+

关键结论

  • CHAR (4) 无论存储多少字符,都占用 12 字节(4×3),不足补空格;
  • VARCHAR (4) 存储 1 字符占用 4 字节(3+1),2 字符占用 7 字节(6+1),4 字符占用 13 字节(12+1),更节省空间。

如何选择定长或变长字符串?

  • 如果数据确定长度都一样,就使用定长(char),比如:身份证,手机号,md5
  • 如果数据长度有变化,就使用变长(varchar), 比如:名字,地址,但是你要保证最长的能存的进去。
  • 定长的磁盘空间比较浪费,但是效率高。
  • 变长的磁盘空间比较节省,但是效率低。
  • 定长的意义是,直接开辟好对应的空间
  • 变长的意义是,在不超过自定义范围的情况下,用多少,开辟多少。

3.3 VARCHAR 长度限制测试

sql 复制代码
-- UTF8编码下,VARCHAR最大字符数=65532/3≈21844(预留1-3字节存长度)
CREATE TABLE test_varchar_limit1(name VARCHAR(21845)) CHARSET=utf8; 
-- 报错:Row size too large. The maximum row size for the used table type, not counting BLOBs, is 65535.

CREATE TABLE test_varchar_limit2(name VARCHAR(21844)) CHARSET=utf8; -- 成功

四. 日期时间类型:DATE/DATETIME/TIMESTAMP 选型

日期时间类型用于存储时间相关数据,核心是区分三者的存储范围、时区特性和自动更新机制:

类型 占用字节 时间范围 时区特性 自动更新 适用场景
DATE 3 1000-01-01 ~ 9999-12-31 生日、日期记录
DATETIME 8 1000-01-01 ~ 9999-12-31 固定时间(如订单创建时间)
TIMESTAMP 4 1970-01-01 ~ 2038-01-19 受时区影响 支持自动更新 时间戳(如最后修改时间)

4.1 TIMESTAMP 自动更新测试

sql 复制代码
-- 1. 创建日期测试表
CREATE TABLE test_datetime(
  t1 DATE,
  t2 DATETIME,
  t3 TIMESTAMP
);

-- 2. 仅插入DATE/DATETIME,TIMESTAMP自动填充当前时间
INSERT INTO test_datetime(t1,t2) VALUES('1997-07-01','2008-08-08 12:01:01');

-- 3. 查询初始结果
SELECT * FROM test_datetime;

运行结果 1

sql 复制代码
+------------+---------------------+---------------------+
| t1         | t2                  | t3                  |
+------------+---------------------+---------------------+
| 1997-07-01 | 2008-08-08 12:01:01 | 2024-05-20 15:30:22 | -- t3自动填充当前时间
+------------+---------------------+---------------------+
sql 复制代码
-- 4. 更新数据,TIMESTAMP自动刷新
UPDATE test_datetime SET t1='2000-01-01';

-- 5. 查询更新结果
SELECT * FROM test_datetime;

运行结果 2

sql 复制代码
+------------+---------------------+---------------------+
| t1         | t2                  | t3                  |
+------------+---------------------+---------------------+
| 2000-01-01 | 2008-08-08 12:01:01 | 2024-05-20 15:35:48 | -- t3自动更新为修改时间
+------------+---------------------+---------------------+

五. 特殊字符串类型:ENUM 与 SET(单选 / 多选场景)

ENUM(枚举)和SET(集合)适用于固定选项的场景,避免手动校验输入合法性。

5.1 ENUM(单选枚举)测试

sql 复制代码
-- 1. 创建枚举表
CREATE TABLE test_enum(
  username VARCHAR(30),
  gender ENUM('男','女')
);

-- 2. 插入合法值
INSERT INTO test_enum VALUES('雷锋','男'); -- 成功
INSERT INTO test_enum VALUES('小红',2); -- 成功(2对应第二个选项'女')

-- 3. 插入非法值(报错)
INSERT INTO test_enum VALUES('Tom','未知'); 
-- 报错:Data truncated for column 'gender' at row 1

-- 4. 查询枚举值
SELECT username, gender, gender+0 FROM test_enum; -- gender+0查看枚举对应的数字
  • 运行结果
sql 复制代码
+----------+--------+-----------+
| username | gender | gender+0  |
+----------+--------+-----------+
| 雷锋     | 男     |         1 |
| 小红     | 女     |         2 |
+----------+--------+-----------+

5.2 SET(多选集合)测试

sql 复制代码
-- 1. 创建集合表
CREATE TABLE test_set(
  username VARCHAR(30),
  hobby SET('登山','游泳','篮球','武术')
);

-- 2. 插入多选值
INSERT INTO test_set VALUES('雷锋','登山,武术'); -- 成功
INSERT INTO test_set VALUES('小红','游泳'); -- 成功(单选)

-- 3. 插入非法值(自动忽略)
INSERT INTO test_set VALUES('Tom','登山,游戏'); -- '游戏'不是选项,仅插入'登山'

-- 4. 查询包含某选项的记录(find_in_set函数)
SELECT * FROM test_set WHERE FIND_IN_SET('登山', hobby);
  • 运行结果
sql 复制代码
+----------+-----------+
| username | hobby     |
+----------+-----------+
| 雷锋     | 登山,武术 |
| Tom      | 登山      |
+----------+-----------+
  • set的这个也可以用数字来代表,不过是由比特位来算的,比如1代表登山,2代表游泳,3代表的是登山和游泳(0011)

六. 数据类型选型避坑指南和总结

  • 按 "最小必要" 原则选型 :如年龄用TINYINT(0-255 足够),不用INT;金额用DECIMAL(10,2),不用FLOAT
  • 避免用字符串存储数字 :如手机号用BIGINTCHAR(11),不用VARCHAR(11)CHAR查询更快);身份证用CHAR(18)(固定长度),不用VARCHAR
  • BIT 类型查询需转数字 :直接查询 BIT 字段显示 ASCII 字符,需用gender+0CAST(gender AS UNSIGNED)转为数字。
  • 慎用 TEXT/BLOB :大文本类型会降低查询性能,若能拆分字段(如将文章摘要单独存储为VARCHAR),尽量避免直接用TEXT
  • 日期类型优先选 DATETIME :除非明确需要时区转换或自动更新,否则DATETIME的兼容性和范围更优,避免TIMESTAMP的 2038 限制。

总结: MySQL 数据类型的选择核心是 "匹配场景 + 平衡性能与空间",本文补充了 PPT 中所有核心测试案例,关键要点总结:

  • BIT/TINYINT 有严格范围限制,插入越界值会直接报错,查询 BIT 需转数字;
  • FLOAT 存在精度丢失,金额等精确场景必须用 DECIMAL;
  • CHAR 适合固定长度字符串(如手机号),VARCHAR 适合可变长度字符串(如姓名);
  • TIMESTAMP 支持自动更新,但有 2038 年限制,普通场景优先用 DATETIME;
  • ENUM/SET 简化固定选项存储,SET 查询需用 find_in_set 函数。

结尾:

html 复制代码
🍓 我是草莓熊 Lotso!若这篇技术干货帮你打通了学习中的卡点:
👀 【关注】跟我一起深耕技术领域,从基础到进阶,见证每一次成长
❤️ 【点赞】让优质内容被更多人看见,让知识传递更有力量
⭐ 【收藏】把核心知识点、实战技巧存好,需要时直接查、随时用
💬 【评论】分享你的经验或疑问(比如曾踩过的技术坑?),一起交流避坑
🗳️ 【投票】用你的选择助力社区内容方向,告诉大家哪个技术点最该重点拆解
技术之路难免有困惑,但同行的人会让前进更有方向~愿我们都能在自己专注的领域里,一步步靠近心中的技术目标!

结语:掌握这些带测试验证的知识点,能避免 80% 的数据库设计问题。如果需要针对具体场景(如电商订单表、用户表)的字段设计方案,欢迎在评论区留言交流!创作不易,觉得有帮助的话,欢迎点赞、收藏、关注三连~ 后续会持续更新 MySQL 约束、索引等进阶内容,带你从入门到精通数据库设计。

✨把这些内容吃透超牛的!放松下吧✨ ʕ˘ᴥ˘ʔ づきらど

相关推荐
半个俗人2 小时前
8.jmeter直连数据库-MySQL
数据库·jmeter
江湖十年2 小时前
AI Agent 生态再添一员,Kratos 带着他的武器 Blades 走来了!
人工智能·后端·go
Saniffer_SH2 小时前
【每日一题】PCIe链路协商的时候进入Polling compliance如何排错?
服务器·人工智能·驱动开发·嵌入式硬件·测试工具·fpga开发·自动化
亚里随笔2 小时前
OpenClaw-RL:让AI Agent在对话中自主学习进化
人工智能·学习·llm·rl·agentic
王乐平2 小时前
Agent Skills 完全科普指南
人工智能
飞飞的AI实验室2 小时前
2026 年 AI 辅助编程工具全景对比:Copilot、Cursor、Claude Code 与 Codex 深度解析
人工智能·ai·copilot·ai编程
co_wait2 小时前
【C++ STL】排序算法
开发语言·c++·排序算法
AI猫站长2 小时前
快讯|阿里ABot-M0发布:基于动作流形学习的VLA基础模型,构建600万轨迹UniACT数据集
人工智能·具身智能·灵心巧手
Alsian2 小时前
Day41 TensorBoard
人工智能·算法·机器学习