扩展
上文提到的utf8_general_ci与ut8_unicode_ci是utf8的两种字符编码方式,不同之处就是对字符的分类(sorting)和对比(comparison)。
MySQL 5.5.3及以后版本支持使用utf8mb4字符集,它在与utf8数据格式处理性能相同基础上加强了对字符码位(code point)的处理能力。与utf8对应的,utf8mb4有utf8mb4_general_ci和utf8mb4_general_ci。
utf8mb4_general_ci 基于Unicode standard sorting与comparison,支持更多的语言种类。
set character_set_client = utf8mb4;
set character_set_connection = utf8mb4;
set character_set_database = utf8mb4;
set character_set_results = utf8mb4;
set character_set_server = utf8mb4;
我们项目用的是阿里的云数据库RDS版,可用其提供的线上管理工具DMS进行设置。
将已经生成的表也转成utf8mb4,
alter table TABLE_NAME convert to character set utf8mb4 collate utf8mb4_bin;