我们知道计算机实际上存储的二进制数据,那么是如何存储字符串数据呢,是不是应该二进制与字符串之间有个映射关系,那么这个映射关系可以称为字符集
将字符映射成二进制数据过程叫做,编码,反之称为解码
UTF-8
字符集对中文汉字,占用3个字节,对于GB2312字符集只占用2个字节,对于一些交互场景(比如:asr与华为语音平台进行交互),为了节省空间,可以改变字符集实现。
但通常一些常用字符只占用1-3字节,用UTF-8,会浪费空间,这时mysql提供了阉割版的字符集是utf8mb3,但是存储一些表情,是需要四个字节,请使用utf8mb4,在mysql8版本,对utf8mb4进行了优化,设置为默认字符集
比较规则可以理解为:两个字符按照某个规则进行比较大小
客户端与服务器通信要设置字符集一致,负责会出现乱码现象