MySql插入中文生僻字/Emoji报错django.db.utils.DataError: (1366, “Incorrect string value

在 Django + MySQL 写入生僻字(4 字节 Unicode)时报错,根本原因是 MySQL 默认的 utf8(实际是 utf8mb3)只支持最多 3 字节的字符,插入 4 字节字符时会触发。

复制代码
django.db.utils.DataError: (1366, "Incorrect string value: '...' for column 'xxxx' at row 1")

执行

python 复制代码
SHOW VARIABLES WHERE Variable_name LIKE 'character_set_%' OR Variable_name LIKE 'collation%';

关键变量解读

变量 含义
character_set_client utf8mb4 客户端发送数据时用的编码
character_set_connection utf8mb4 服务器接收并处理客户端数据用的编码
character_set_results utf8mb4 服务器返回结果给客户端时用的编码
character_set_database utf8 新建数据库时默认采用的编码
character_set_server utf8 服务器端级别的默认编码
collation_connection utf8mb4_0900_ai_ci 连接层面的排序/比较规则
collation_database utf8_unicode_ci 数据库层面的排序/比较规则
collation_server utf8_unicode_ci 服务器层面的排序/比较规则

解决步骤:

1/在 Django 中指定 utf8mb4 连接

python 复制代码
DATABASES = {
    'default': {
        'ENGINE':   'django.db.backends.mysql',
        'NAME':     'your_db',
        'USER':     'your_user',
        'PASSWORD': 'your_pass',
        'HOST':     'localhost',
        'OPTIONS': {
            'charset':     'utf8mb4',
            'init_command': "SET NAMES utf8mb4 COLLATE utf8mb4_unicode_ci",
        },
    }
}

2/转换数据库 / 表 / 字段字符集

python 复制代码
以下三种,根据情况选中其中一种进行操作


-- 整库转换
ALTER DATABASE your_db
  CHARACTER SET = utf8mb4
  COLLATE = utf8mb4_unicode_ci;

-- 整表转换
ALTER TABLE your_table
  CONVERT TO CHARACTER SET utf8mb4
  COLLATE utf8mb4_unicode_ci;

-- 或单列转换
ALTER TABLE your_table
  MODIFY COLUMN Address VARCHAR(255)
  CHARACTER SET utf8mb4
  COLLATE utf8mb4_unicode_ci;
操作 作用范围 对已存在数据的影响 什么时候必须执行
ALTER DATABASE 整个数据库(默认值) 会自动转换已存在表或列,只改变以后新建的表/列默认字符集和校对规则。 你想让后来所有新表、新列都自动用 utf8mb4 时执行;否则可跳过。
ALTER TABLE ... CONVERT TO 整张表(所有列) 会遍历该表所有字符列,将列定义和存储的数据都转换为 utf8mb4,并重建表。 想一次性把整张表的所有字符列都切到 utf8mb4 时执行;要转换多列时最便捷。
ALTER TABLE ... MODIFY COLUMN 单个字段 只修改指定列的字符集和校对规则,并在必要时转换该列数据;对其他列无影响。 只需某一个字段支持 4 字节字符时执行;影响最小、锁表时间最短。

一般来说可以第一+ 第二

相关推荐
SamsongSSS6 小时前
Django之APPEND_SLASH配置爬坑
后端·python·django
档案宝档案管理6 小时前
档案管理系统如何对企业效率重构与提升?
大数据·数据库·人工智能·重构·档案·档案管理
TimberWill6 小时前
PostgreSQL表备份并重命名出现索引、外键仍指向旧表,恢复后仍失败的问题
数据库·postgresql
沐浴露z7 小时前
MySQL MVCC:通过 ReadView与 undolog版本链 分析读提交RC和可重复读RR的原理
数据库·mysql·innodb·mvcc
阿巴~阿巴~7 小时前
MySQL索引特性(重点)
服务器·数据库·sql·mysql·ubuntu
NiNi_suanfa7 小时前
【MySQL数据库】InnoDB实现MVCC(多版本并发控制)底层原理
数据库·mysql
qq_172805598 小时前
好用的 SQLite3 ORM 开源库
数据库·sqlite·开源
jackletter8 小时前
五大关系数据库(sqlserver、mysql、oracle、pgsql、sqlite)的对象名称和转义字符
mysql·postgresql·oracle·sqlserver·sqlite
AWS官方合作商8 小时前
打破数据枷锁:在AWS上解锁Oracle数据库的无限潜能
数据库·oracle·aws
会飞的架狗师8 小时前
【MySQL体系】第2篇:MySQL索引类型和原理
数据库·mysql