Golang 如何使用 gorm 存取带有 emoji 表情的数据

Golang 如何使用 gorm 存取带有 emoji 表情的数据

  • [结论:在 mysql 中尽量使用 utf8mb4,不要使用 utf8。](#结论:在 mysql 中尽量使用 utf8mb4,不要使用 utf8。)
  • [db报错信息:`Error 1366 (HY000): Incorrect string value: '\\xE6\\x8C\\xA5\\xE7\\xAC\\xA6...'`](#db报错信息:Error 1366 (HY000): Incorrect string value: '\\xE6\\x8C\\xA5\\xE7\\xAC\\xA6...')
  • [根本原因:emoji 4个字节,mysql 的 utf8 3个字节,mysql 的 utf8mb4 4个字节](#根本原因:emoji 4个字节,mysql 的 utf8 3个字节,mysql 的 utf8mb4 4个字节)
  • 解决方案:
    • [1. 【前置条件】修改数据库的字符集配置,然后重启数据库:确保存储emoji的字段类型为 `utf8mb4`](#1. 【前置条件】修改数据库的字符集配置,然后重启数据库:确保存储emoji的字段类型为 utf8mb4)
    • [2. 修改 gorm 的数据库连接串配置,改为 `charset=utf8mb4`,然后重启项目](#2. 修改 gorm 的数据库连接串配置,改为 charset=utf8mb4,然后重启项目)
  • 其他补充:
  • 关联文档:

结论:在 mysql 中尽量使用 utf8mb4,不要使用 utf8。

db报错信息:Error 1366 (HY000): Incorrect string value: '\\xE6\\x8C\\xA5\\xE7\\xAC\\xA6...'

根本原因:emoji 4个字节,mysql 的 utf8 3个字节,mysql 的 utf8mb4 4个字节

emoji 表情是4个字节,而 mysql 的 utf8 编码最多3个字节,所以数据插不进去。

而 mysql 的 utfmb4 是支持4个字节的,所以将 mysql 编码从 utf8 转换成 utf8mb4 就能解决。

解决方案:

1. 【前置条件】修改数据库的字符集配置,然后重启数据库:确保存储emoji的字段类型为 utf8mb4

根据实际需要选择运行下面的sql语句:

sql 复制代码
# 修改数据库字符集:
ALTER DATABASE db_name CHARACTER SET = utf8mb4 COLLATE = utf8mb4_general_ci;

# 修改表的字符集:
ALTER TABLE table_name CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;

# 修改字段的字符集:
ALTER TABLE table_name CHANGE column_name column_name VARCHAR(64) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;

#查看表字段的字符集
show full columns from table_name;

2. 修改 gorm 的数据库连接串配置,改为 charset=utf8mb4,然后重启项目

比如:
user:password@tcp(host)/dbname?charset=utf8&parseTime=True&loc=Local

修改为 charset=utf8mb4 后:
user:password@tcp(host)/dbname?charset=utf8mb4&parseTime=True&loc=Local

其他补充:

  1. MySQL 5.7 及之前版本默认的字符集是 latin1,MySQL 8.0 版本默认的字符集是 utf8mb4 。
  2. 不过使用 latin1 容易导致乱码,所以还是 utf8 和 utf8mb4 用途最广泛。
  3. mysql 的 utf8 其实是 utf8mb3 的别名,只使用 1~3 个字节表示字符。
  4. mysql 的 utf8mb4 使用 1~4 个字节表示字符,能够存储更多的 emoji 表情及任何新增的 Unicode 字符。utf8mb4 兼容 utf8 ,且比 utf8 能表示更多的字符,是 utf8 字符集的超集。
  5. 所以现在一些新的业务建议将数据库的字符集设置为 utf8mb4 ,特别是有表情存储需求时。

关联文档:

mysql 函数 md5 踩坑记录,报错:Error 1366 (HY000): Incorrect string value: '\xE6\x8C\xA5\xE7\xAC\xA6...

相关推荐
coding随想16 分钟前
JavaScript的三大核心组成:ECMAScript、DOM与BOM
开发语言·javascript·ecmascript
0xCC说逆向26 分钟前
Windows逆向工程提升之IMAGE_EXPORT_DIRECTORY
开发语言·数据结构·windows·安全·网络安全·pe结构·逆向工程
带电的小王27 分钟前
C++:动态刷新打印内容
开发语言·c++
贺函不是涵28 分钟前
【沉浸式求职学习day47】【JSP详解】
java·开发语言·学习
满怀101544 分钟前
【Python正则表达式终极指南】从零到工程级实战
开发语言·python·正则表达式·自动化·文本处理·数据清晰
草莓熊Lotso1 小时前
【自定义类型-结构体】--结构体类型,结构体变量的创建和初始化,结构体内存对齐,结构体传参,结构体实现位段
c语言·开发语言·经验分享·笔记·其他
旋风菠萝1 小时前
八股--SSM(2)
java·开发语言·数据库·八股·八股文·复习
攻心的子乐1 小时前
Flyweight(享元)设计模式 软考 享元 和 代理属于结构型设计模式
java·开发语言
编程乐学(Arfan开发工程师)1 小时前
16、最佳实践-SpringBoot应用如何编写
java·spring boot·后端
君的名字2 小时前
怎么判断一个Android APP使用了Qt 这个跨端框架
android·开发语言·qt