MySQL 中 utf8mb4 字符集,字母a占几个字节,一个汉字占几个字节 / MySQL 中 utf8mb3 字符集,字母a占几个字节,一个汉字占几个字节

MySQL 中 utf8mb4 字符集,字母a占几个字节,一个汉字占几个字节

在 MySQL 的 utf8mb4 字符集中,字节占用情况如下:

  • 字母 a :占用 1 个字节
  • 一个汉字 :通常占用 3 个字节

为了让你更全面地理解,我为你整理了详细的对比和说明:

📊 1. utf8mb4 字符存储规则

utf8mb4 是 MySQL 中真正的 UTF-8 编码实现,它是一种变长 编码,根据字符的不同,占用 1 到 4 个字节。

字符类型 示例 占用字节数 说明
ASCII 字符 a, b, 1, @ 1 字节 英文字母、数字、符号通常都是 1 字节

基本多文平面字符 昆、京、你好 3 字节 绝大多数常用汉字、日文、韩文等

补充字符 😊, 🚀, 👨👩👧👦 4 字节 Emoji 表情、生僻汉字、特殊符号

💡 2. 重点补充说明

  • 为什么叫 utf8mb4?

    它的名字意思是 "UTF-8 Most Bytes 4"(最多 4 个字节)。这与 MySQL 旧版本中的 utf8(实际上是 utf8mb3,最多只支持 3 字节)不同。如果你需要存储 Emoji 表情(如 😂),必须使用 utf8mb4,否则会报错或乱码。

  • 大小写是否影响字节?

    不影响。无论是大写字母 A 还是小写字母 a,在 utf8mb4 中都占用 1 个字节。

  • 如何查看字节长度?

    在 MySQL 中,你可以使用 LENGTH() 函数查看字节长度,使用 CHAR_LENGTH() 查看字符个数。

    • SELECT LENGTH('a'); -- 结果:1
    • SELECT LENGTH('你'); -- 结果:3
    • SELECT LENGTH('a你'); -- 结果:4 (1 + 3)

总结: 在日常开发中,你可以简单记为:英文占 1 字节,汉字占 3 字节,Emoji 占 4 字节

MySQL 中 utf8mb3 字符集,字母a占几个字节,一个汉字占几个字节

在 MySQL 的 utf8mb3 字符集中,字节占用情况如下:

  • 字母 a :占用 1 个字节
  • 一个汉字 :占用 3 个字节

为了让你更清晰地理解,这里有一些详细的补充说明:

📊 1. utf8mb3 字符存储规则

utf8mb3 是 MySQL 中旧版 UTF-8 的实现(在 MySQL 8.0 中,utf8 是 utf8mb3 的别名)。

字符类型 示例 占用字节数 说明
ASCII 字符 a, b, 1, @ 1 字节 兼容标准 ASCII 编码

常用字符 昆、京、你好 3 字节 包含绝大多数常用汉字、日文、韩文等

⚠️ 2. 关键限制(与 utf8mb4 的区别)

虽然字母和汉字的占用与 utf8mb4 相同,但 utf8mb3 有一个致命的限制:

  • 不支持 4 字节字符 :utf8mb3 最多只支持 3 个字节。这意味着它无法存储 Emoji 表情(如 😊、🚀)或一些罕见的生僻字。
  • 如果你尝试插入这类字符,MySQL 会报错(错误代码 1366)或将其截断为问号。

💡 3. 总结建议

  • 如果你的业务只需要存储英文和常用汉字:utf8mb3 是够用的,且比 utf8mb4 省一点点空间(理论上)。
  • 如果你的业务涉及用户输入(如社交 App、评论系统)强烈建议使用 utf8mb4,因为用户极有可能输入 Emoji 表情,使用 utf8mb3 会导致数据写入失败。
相关推荐
陌上丨3 小时前
Redis的Key和Value的设计原则有哪些?
数据库·redis·缓存
AI_56784 小时前
AWS EC2新手入门:6步带你从零启动实例
大数据·数据库·人工智能·机器学习·aws
ccecw4 小时前
Mysql ONLY_FULL_GROUP_BY模式详解、group by非查询字段报错
数据库·mysql
JH30734 小时前
达梦数据库与MySQL的核心差异解析:从特性到实践
数据库·mysql
数据知道4 小时前
PostgreSQL 核心原理:如何利用多核 CPU 加速大数据量扫描(并行查询)
数据库·postgresql
麦聪聊数据5 小时前
Web 原生架构如何重塑企业级数据库协作流?
数据库·sql·低代码·架构
未来之窗软件服务5 小时前
数据库优化提速(四)新加坡房产系统开发数据库表结构—仙盟创梦IDE
数据库·数据库优化·计算机软考
Goat恶霸詹姆斯7 小时前
mysql常用语句
数据库·mysql·oracle
大模型玩家七七7 小时前
梯度累积真的省显存吗?它换走的是什么成本
java·javascript·数据库·人工智能·深度学习
曾经的三心草7 小时前
redis-9-哨兵
数据库·redis·bootstrap