[java基础]char类型储存到计算机的过程&字符编码

发布时间:2024年01月20日

字符型存储到 计算机中,需要将字符对应的码值(整数)找出来,比如'a' 存储:'a'==>码值97==>二进制(1100001)==>存储 读取:二进制(1100001)=>97===>'a'=>显示

?字符编码表介绍:


ASCIl(ASCIl编码表?一个字节?表示, 一个128个字符, 实际上一个字节有八位可以表示256个字符, 只用128个, 为什么没有用完是因为计算机是美国人造出的, 英文只有24个, 算上特殊子字符128个足够表示所有字符了)

ASClI码:上个世纪60年代,美国制定了一套字符编码(使用一个字节),对英语字符与二进制位之间的关系,做了统一规定。这被称为ASClI码。ASCI码一共规定 了128个字符的编码,只占用了一个字节的后面7位,最前面的1位统一规定为0。 特别提示:一个字节可以表示256个字符,ASCII码只用了 128个字符.


Unicode(Unicode编码表固定大小的编码使用两个字节来表示字符,字母和汉字统一都是占用两个字节, 这样浪费空间, 为什么有了ascll码还要有其他编码, 因为计算机其他国家也要用, 例如中国,? 中国汉字特别多, 128个字符就远远不够, 256个也不够, 所以有了Unicode码, 它是ascll的扩展)

Unicode码:

1.好处:一种编码,将世界上所有的符号都纳入其中。每一个符号都给予一个独一无二的编码,使用 Unicode 没有乱码的问题。

2.Unicode的缺点:一个英文字母和一个汉字都占用2个字节,这对于存储空间来说是浪费。

3.2的16次方是65536,所以最多编码是65536个字符。

4.编码0-127的字符是与ASCII的编码一样.比如'a'在ASCII码是Ox61,在unicode码是 ox0061,都对应97.因此 Unicode码兼容ASCII码.


utf-8(编码表, 相比于Uniode, 这个编码大小可变, 字母使用1个字节,汉字使用3个字节

1.UTF-8是在互联网上使用最广的一种 Unicode 的实现方式(可以说是Unicode的改进)

2.UTF-8是一种变长的编码方式。它可以使用1-6个字节表示一个符号,根据不同的符号而变化字节长度。

3.使用大小可变的编码字母占1个字节,汉字占3个字节?


gbk(可以表示汉字,而且范围广,字母使用1个字节,汉字2个字节,?但没有utf-8表示的汉字多)?

gb2312(也可以表示汉字,但是范围gb2312<gbk)?

big5(可以表示繁体中文,台湾,香港用的比较多)

文章来源:https://blog.csdn.net/YJH000_/article/details/135716225
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。