做一个简单的如下的连表查询,居然直接提示错误,居然是字符集不一致的问题,本文记录一下mysql的字符集类型,以及下面这个问题的解决方案
1 | select a.id, b.id from tt as a, t2 as b where a.xx = b.xx |
1. 解决方法
先来看上面这个问题的解决方法,最容易想到的就是统一两张表的字符集,要么都是utf8mb4_general_ci
,要么就都是utf8mb4_unicode_ci
,统一一下这个问题就自然解决了
如果我不想修改表的字符集呢?毕竟生产环境下,做这种操作还是有风险的,下面是一种不太优雅的解决方法
- 在字段后面指定字符集(可以全部都指定为
utf8mb4_general_ci
当然也可以全部指定为utf8mb4_unicode_ci
, 根据实际需要进行处理即可)
1 | select a.id, b.id from tt as a, t2 as b where a.xx = b.xx collate utf8mb4_general_ci |
2. mysql字符集
字符集
对于国内的小伙伴,一般而言我们常见的字符集有下面三种
gbk
: 两字节utf8
: 三个字节utf8mb4
: 四个字节
而mysql实际支持的就比较多了,可以通过show charset;
进行查询
校验规则
在实际的case中,经常会看到下面几种
utf8_bin
utf8mb4_unicode_ci
utf8mb4_general_ci
latin1_general_cs
当然我们也可以通过 show collation;
查看所支持的校验规则
请注意上面的写法
- ci:
case insensitive的缩写
大小写不敏感 - cs:
case sensitive
大小写敏感 - bin: 二进制存储,大小写敏感
II. 其他
1. 一灰灰Blog: https://liuyueyi.github.io/hexblog
一灰灰的个人博客,记录所有学习和工作中的博文,欢迎大家前去逛逛
2. 声明
尽信书则不如,以上内容,纯属一家之言,因个人能力有限,难免有疏漏和错误之处,如发现bug或者有更好的建议,欢迎批评指正,不吝感激
- 微博地址: 小灰灰Blog
- QQ: 一灰灰/3302797840
3. 扫描关注
一灰灰blog