建库字符集选择`utf8mb4` + `utf8mb4_unicode_ci` 组合

在 MySQL 中创建 UTF-8 编码的数据库时,请直接使用 **`utf8mb4`** 字符集(而非旧版的 `utf8`),这是 MySQL 中真正的 UTF-8 实现。以下是具体操作和注意事项:


一、创建数据库(2种方式)

1. 基础版(自动选择默认校对规则)

```sql

CREATE DATABASE your_database_name

CHARACTER SET utf8mb4

COLLATE utf8mb4_unicode_ci;

```

2. 精简版(MySQL 8.0+ 默认使用 `utf8mb4`)

```sql

CREATE DATABASE your_database_name;

```


二、为什么必须选 `utf8mb4`?

  • ✅ **完全支持 Unicode**:包含 Emoji 表情符号(如 😊)、生僻汉字、特殊符号等(`utf8` 仅支持 3 字节字符,无法存储 4 字节字符)。

  • ✅ **兼容性**:现代 MySQL 版本(5.5.3+)均支持,且是当前标准方案。


三、校对规则选择(`COLLATE`)

  • **`utf8mb4_unicode_ci`**:基于 Unicode 标准排序,准确性高(推荐)。

  • **`utf8mb4_general_ci`**:旧式简单排序,速度快但准确性略低(已逐渐淘汰)。


四、后续使用注意事项

  1. **创建表时显式指定字符集**(避免继承服务器默认配置):

```sql

CREATE TABLE your_table (

id INT PRIMARY KEY,

content VARCHAR(255)

) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

```

  1. **连接字符串配置**(确保应用层与数据库编码一致):
  • JDBC 示例:`jdbc:mysql://host/db?useUnicode=true&characterEncoding=UTF-8`

  • 其他语言同理,需明确指定 UTF-8 编码。


五、验证设置是否生效

```sql

-- 查看数据库编码

SELECT SCHEMA_NAME, DEFAULT_CHARACTER_SET_NAME, DEFAULT_COLLATION_NAME

FROM INFORMATION_SCHEMA.SCHEMATA

WHERE SCHEMA_NAME = 'your_database_name';

-- 查看表编码

SHOW CREATE TABLE your_table;

```


**总结**:直接使用 `utf8mb4` + `utf8mb4_unicode_ci` 组合,确保全面兼容 Unicode 并避免未来编码问题。

相关推荐
消失的旧时光-194318 分钟前
Android模块化架构:基于依赖注入和服务定位器的解耦方案
android·java·架构·kotlin
@ chen1 小时前
Spring Boot 解决跨域问题
java·spring boot·后端
洛_尘1 小时前
Java EE进阶2:前端 HTML+CSS+JavaScript
java·前端·java-ee
转转技术团队2 小时前
转转上门隐私号系统的演进
java·后端
皮皮林5512 小时前
Java+Selenium+快代理实现高效爬虫
java
hqxstudying3 小时前
Java行为型模式---策略模式
java·开发语言·建造者模式·适配器模式·策略模式
lxsy3 小时前
spring-ai-alibaba 简化版NL2SQL
java·nl2sql·spring-ai·ai-alibaba
WanderInk3 小时前
依赖对齐不再“失联”:破解 feign/BaseBuilder 错误实战
java·后端·架构
菜鸡上道3 小时前
Maven入门指南:生命周期、阶段和执行顺序详解
java·maven
许苑向上3 小时前
分布式缓存击穿以及本地击穿解决方案
java·分布式·缓存