MySQL字符集排序规则冲突问题（utf8mb4_unicode_ci和utf8mb4_0900_ai_ci ）

[MySQL字符集排序规则冲突问题（utf8mb4_unicode_ci和utf8mb4_0900_ai_ci ）](#MySQL字符集排序规则冲突问题（utf8mb4_unicode_ci和utf8mb4_0900_ai_ci ）)

不同 collation 的表进行 JOIN 操作报错：

bash 复制代码

Illegal mix of collations (utf8mb4_0900_ai_ci,IMPLICIT) and (utf8mb4_unicode_ci,IMPLICIT) for operation '='

字符集：utf8mb4

排序规则：基于 Unicode Collation Algorithm (UCA) 的较早版本（历史上对应较老的 Unicode 版本实现）

后缀：_ci = case-insensitive（不区分大小写）

字符集：utf8mb4

排序规则：基于 UCA 9.0.0（0900 就是 9.0.0）

后缀：_ai = accent-insensitive（不区分重音/音标差异），_ci = 不区分大小写

这是 MySQL 8.0 时代的"新默认系"之一（常见默认是 utf8mb4_0900_ai_ci）

推荐用 utf8mb4_unicode_ci，但是用 utf8mb4_general_ci 也没啥问题。

MySQL 8.0 默认的是 utf8mb4_0900_ai_ci，属于 utf8mb4_unicode_ci 中的一种，具体含义如下：

uft8mb4 表示用 UTF-8 编码方案，每个字符最多占 4 个字节。
0900 指的是 Unicode 校对算法版本。（Unicode 归类算法是用于比较符合 Unicode 标准要求的两个 Unicode 字符串的方法）。
ai 指的是口音不敏感。也就是说，排序时 e，è，é，ê 和 ë 之间没有区别。
ci 表示不区分大小写。也就是说，排序时 p 和 P 之间没有区别。
utf8mb4 已成为默认字符集，在 MySQL 8.0.1 及更高版本中将 utf8mb4_0900_ai_ci 作为默认排序规则。以前，utf8mb4_general_ci 是默认排序规则。由于 utf8mb4_0900_ai_ci 排序规则现在是默认排序规则，因此默认情况下新表格可以存储基本多语言平面之外的字符。

如果是mysql8.0，将相关表/字段的 collation 统一为数据库默认 utf8mb4_0900_ai_ci，以消除跨表字符串比较时的 collation 冲突，提升线上查询稳定性并降低后续维护成本。

生产环境思路：应该先检查数据库默认字符集和 collation，统一相关表的 collation 为数据库服务器默认。

表创建时没有显式指定 COLLATE，它继承的是数据库级别的 collation

执行前建议先确认数据库 collation

sql 复制代码

SHOW VARIABLES LIKE 'collation_%';

当 CREATE TABLE 没有显式指定 COLLATE 时，表继承的是数据库级别 (collation_database) 的 collation，而不是服务器级别的。