为什么腾讯云数据库设置为 utf8mb4 后仍然出现乱码?

问题描述

我们使用 MySQL 在特定业务场景(帖子、评论、个人签名)存储 emoji 表情。Server 配置和建表语句统一使用 utf8mb4,仍然抛出如下错误: java.sql.SQLException: Incorrect string value: '\xF0\x9F\x92\x94' for column 'name' at row 1

原因分析

MySQL 的 utf8 编码最多支持 3 个字节,而 emoji 表情需要占用 4 个字节,在早期的版本并没有实现真正意义上的 utf8 字符集。MySQL 从 5.5.3 版本开始支持 utf8mb4 字符集。

我们检查了 Server 的版本和配置,确定字符集用的是 utf8mb4,也检查了客户端连接 Server 的参数,也没发现其他异常。

将代码部署到自建的 MySQL 环境,可以正常存储,但是部署到云数据库 MySQL,就会报错,基本上判断是云厂商配置的问题。

因云数据库的环境不支持在 Server 端配置 character-set-client-handshake 或者 init_connect 参数,我们使用了 HikariCP 数据库连接池框架,在数据库连接池框架初始化连接之前传入 set names utf8mb4; 命令处理,代码片段如下。

yaml 复制代码
spring:
  datasource:
    hikari:
      connection-init-sql: SET NAMES utf8mb4

修改配置后,问题解决。

故障复盘

云厂商数据库通过 proxy 代理,屏蔽了客户端和服务器之间的细节,导致我们很难排查出问题的根本原因。对于 MySQL 的字符存储问题,我们通常会通过以下方式来排查问题。

检查客户端代码的会话字符集

例如 HikariCP 数据库连接池框架,在数据库连接池框架初始化连接之前传入 set names utf8mb4; 命令,让客户端告知 Server,使用 utf8mb4 字符集。

检查 MySQL 服务端的字符集

通过以下语句查看 MySQL 服务端的字符集是否为 utf8mb4

sql 复制代码
SHOW VARIABLES WHERE VARIABLE_NAME LIKE 'character_set_database' OR VARIABLE_NAME LIKE 'collation%';

如果不是,调整 MySQL 的配置文件,关键代码片段如下。

ini 复制代码
[client]
default-character-set = utf8mb4

[mysql]
default-character-set = utf8mb4

[mysqld]
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci
init_connect='SET NAMES utf8mb4'
character-set-client-handshake = FALSE

重启 MySQL Server,重新确认 MySQL 服务端的字符集是否修改成功。

检查 JDBC 连接信息

去除 characterEncoding 选项,让 MySQL 连接器选择服务端的字符集。

sql 复制代码
jdbc:mysql://localhost:3306/db?useUnicode=true&&zeroDateTimeBehavior=convertToNull&autoReconnect=true

修改历史数据的字符集

对于存储了字符编码为 utf8 的历史数据,如果要支持 utf8mb4 ,需要将已经存在的数据库、表、列的类型修改成 utf8mb4

首先,调整数据库的默认字符集。

sql 复制代码
ALTER DATABASE <database_name> CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

修改表或者列的字符集。

sql 复制代码
ALTER TABLE <table_name> CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

如果您不希望修改整个表的字符集,可以选择指定 Column 进行调整。

sql 复制代码
ALTER TABLE <table_name> MODIFY COLUMN <column_name> VARCHAR(512) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
相关推荐
悠悠121382 分钟前
一条 SQL 从敲下回车,到在 MySQL 里“跑完一生”,中间到底经历了啥?
数据库·sql·mysql
秋913 分钟前
MySQL 9.7.0 使用详解:新特性、实战与避坑指南
android·数据库·mysql
努力努力再努力wz1 小时前
【MySQL进阶系列】拒绝冗余SQL:带你透彻理解视图的底层逻辑
android·c语言·数据结构·数据库·c++·sql·mysql
历程里程碑1 小时前
MySQL数据类型全解析 + 代码实操讲解
大数据·开发语言·数据库·sql·mysql·elasticsearch·搜索引擎
杨云龙UP1 小时前
Windows Server 2012 环境下 Oracle 11.2 使用 expdp 实现自动备份、异地复制与定期清理_20260504
服务器·数据库·windows·mysql·docker·oracle·容器
nbwenren1 小时前
MySQL数据库误删恢复_mysql 数据 误删
数据库·mysql·adb
星光开发者1 小时前
基于springboot电动汽车租赁管理系统-计算机毕设 附源码 11217
javascript·spring boot·mysql·django·php·html5·express
带鱼吃猫2 小时前
从原子性到串行化:数据库事务全解
数据库·mysql
IT学长2 小时前
JavaWeb图书管理系统设计与实现(附源码)
mysql·servlet·毕业设计·课程设计·图书管理系统
秋92 小时前
MySQL 8.4.9 LTS 与 MySQL 9.7.0 LTS 全方位深度对比
数据库·mysql