[java基础]char类型储存到计算机的过程&字符编码

发布时间：2024年01月20日

字符型存储到计算机中，需要将字符对应的码值（整数）找出来，比如'a' 存储：'a'==>码值97==>二进制（1100001）==>存储读取：二进制（1100001）=>97===>'a'=>显示

?字符编码表介绍:

ASCIl（ASCIl编码表?一个字节?表示, 一个128个字符, 实际上一个字节有八位可以表示256个字符, 只用128个, 为什么没有用完是因为计算机是美国人造出的, 英文只有24个, 算上特殊子字符128个足够表示所有字符了）

ASClI码：上个世纪60年代，美国制定了一套字符编码（使用一个字节），对英语字符与二进制位之间的关系，做了统一规定。这被称为ASClI码。ASCI码一共规定了128个字符的编码，只占用了一个字节的后面7位，最前面的1位统一规定为0。特别提示：一个字节可以表示256个字符，ASCII码只用了 128个字符.

Unicode（Unicode编码表固定大小的编码使用两个字节来表示字符，字母和汉字统一都是占用两个字节，这样浪费空间, 为什么有了ascll码还要有其他编码, 因为计算机其他国家也要用, 例如中国,? 中国汉字特别多, 128个字符就远远不够, 256个也不够, 所以有了Unicode码, 它是ascll的扩展）

Unicode码:

1.好处：一种编码，将世界上所有的符号都纳入其中。每一个符号都给予一个独一无二的编码，使用 Unicode 没有乱码的问题。

2.Unicode的缺点：一个英文字母和一个汉字都占用2个字节，这对于存储空间来说是浪费。

3.2的16次方是65536，所以最多编码是65536个字符。

4.编码0-127的字符是与ASCII的编码一样.比如'a'在ASCII码是Ox61,在unicode码是 ox0061,都对应97.因此 Unicode码兼容ASCII码.

utf-8（编码表, 相比于Uniode, 这个编码大小可变, 字母使用1个字节，汉字使用3个字节）

1.UTF-8是在互联网上使用最广的一种 Unicode 的实现方式(可以说是Unicode的改进)

2.UTF-8是一种变长的编码方式。它可以使用1-6个字节表示一个符号，根据不同的符号而变化字节长度。

3.使用大小可变的编码字母占1个字节，汉字占3个字节?

gbk（可以表示汉字，而且范围广，字母使用1个字节，汉字2个字节,?但没有utf-8表示的汉字多）?

gb2312（也可以表示汉字，但是范围gb2312<gbk）?

big5（可以表示繁体中文，台湾，香港用的比较多）

文章来源:https://blog.csdn.net/YJH000_/article/details/135716225
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！