详解Java乱码问题,深入ASCII、GBK、UTF-8编码和解码(一学就会,通俗易懂版)

发布时间:2023年12月22日

ASCII及GBK

image-20231206201736611

GBK一个汉字用两个字节表示

image-20231206202954852

Unicode(UTF32到UTF-8)——推荐使用

image-20231206201921051

image-20231206202145512

最初是UTF-32,但是会使得通信效率变低,才有了UTF-8

image-20231206202831950

英文字符、数组及标点符号都是1个字节,汉字占3个字节。

字符集的编码、解码

字符编码时的使用的字符集,和解码时使用的字符集必须一致,否则会出现乱码。

image-20231206203216784

image-20231206203416254

示例代码:

1.编码

image-20231206203620380

image-20231206203750718

2.解码

image-20231206203919821

字符串"GBK"代码GBK编码,字符串"UTF-8"代表UTF-8编码。

文章来源:https://blog.csdn.net/qq_62614525/article/details/135157867
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。