【重学C语言】三、进制转换、整数浮点数存储模型

发布时间:2024年01月17日

1. 进制装换

1.1 什么是进制

进制也就是进位计数制,是认为定义的带进位的计数方法,对于任何一种进制——N进制,就表示每一位置上的数运算时都是逢N进一位。

数数相信大家都会了,比如0 1 2 3 4 5 6 7 8 9 10 11 12 13…,在数数时某一位数量满10了就向前进位,这种逢十进一的进位制,就叫十进制。

不过在日常生活中,并不止这一种进位制,比如1小时有60分钟,1分钟有60秒,满60进一,这就是六十进制。

而在计算机中常用的进制除了十进制,还有二进制八进制十六进制

1.2 十进制

组成:0 1 2 3 4 5 6 7 8 9

规则:逢十进一

表示方式:十进制数520可写成(520)10或写成520D

1.3 二进制

组成:0 1

规则:逢二进一

表示方式:二进制数1000010可写成(1000010)2或写成1000010B

1.4 八进制

组成:0 1 2 3 4 5 6 7

规则:逢八进一

表示方式:八进制数520可写成(520)8或写成520O

1.5 十六进制

组成:0 1 2 3 4 5 6 7 8 9 A B C D E F

规则:逢十六进一

表示方式:十六进制的520可以写成(520)16或写成520H

为什么在计算机中,有多种进制表示方式?

  • 方便:二进制有两个数码0和1,可用具有两个不同稳定状态的元器件来表示一位数码
  • 简单:二进制运算简单,大大简化了计算中运算部件的结构
  • 真假:二进制天然兼容逻辑运算
  • 缺点:二进制计数在日常使用上有个不便之处,就是位数往往很长,读写不便,如:把十进制的100000D写成二进制就是11000011010100000B,所以计算机领域我们实际采用的是十六进制。二进制数转换为十六进制数时,长度缩减为原先的约四分之一,把十进制的100000写成八进制就是303240。十六进制的一个数位可代表二进制的四个数位。这样,十进制的100000写成十六进制就是186A0。

2. 存储单位

我们平常使用的程序,一般安装在硬盘等外存上,但仅此是不能使用其功能,必须把它们调入内存中运行,才能真正其功能。

因为内存的读写速度相对于外存来说非常快,但是内存是暂时存储程序以及数据的地方。当我们使用WPS处理文稿时,当你在键盘上敲入字符时,它被存入内存中。当你选择存盘时,内存中的数据才会被存入硬(磁)盘。

内存是由无数个晶体管组成的(可以理解为灯泡),一个晶体管作为一比特(bit)的存储器。每个晶体管可以存储一个二进制0或1,比特通常也叫做位。

  • 位(bit): 计算机存储的最小单位

  • 字节(byte): 数据表示的最小单位

    • 一个字节通常8位长 1byte = 8 bit
  • 千字节(KB):

    • 1KB = 1024byte
    • 为什么是1024,而不是1000呢?二的十次方刚好是1024,就这么表示啦~

    字节以上的转换单位都是1024,只有一个字节等于八个位是不一样的…

  • 兆字节(MB):

  1. 1MB = 1024KB
  2. 1GB = 1024MB
  3. 1TB = 1024GB

思考:为什么硬盘标注的容量与实际的容量不一样?

买的256G硬盘实际上只有238.4G,咱们一起来换算一下:

硬盘厂商十进制计算:256G = 256,000MB = 256,000,000KB = 256,000,000,000Byte 以1000为单位换算

操作系统二进制计算: 256G = 262,144MB = 268,435,456KB = 274,877,906,944Byte 以1024为单位换算

那么256G实际容量:256,000,000,000Byte/1024MB/1024MB/1024MB = 238.4G

所以,买256G硬盘实际上只有238.4G,而且容量越大差距也就越大了。

3. 进制转换

在这里插入图片描述
十进制转其他进制:短除法

  • 以十进制数520为例,分别转换为二进制、八进制和十六进制,转换过程如下:

在这里插入图片描述

其它进制转十进制:位权相加

  • 就以上面的520D的二进制、八进制和十六进制为例
  • 首先,需要对其他进制从右往左依次开始编号,0 1 2 3 4 5 …
  • 然后,把每一位的数通过这个公式【数值 * 基数^编号】计算,然后把结果相加,即得到转换结果

在这里插入图片描述
八进制、十六进制与二进制相互转换:拆位

在这里插入图片描述

为什么可以这样拆位呢?

  • 三位二进制数表示的范围是[0 - 8) -> 23 对于八进制来说刚刚好

  • 四位二进制数表示的范围是[0 - 16) -> 24 对于十六进制来说刚刚好

4. 整数的存储方式

4.1 机器数和机器数的真值

4.1.1 机器数

一个数在计算机中的二进制表示形式,叫做这个数的机器数。机器数是带符号的,在计算机用机器数的最高位存放符号,正数为0,负数为1。

比如,十进制中的数 +3 ,计算机字长为8位,转换成二进制就是0000 0011,如果是 -3 ,就是 100 00011 。

那么,这里的 0000 0011 和 1000 0011 就是机器数。

4.1.2 机器数的真值

因为第一位是符号位,所以机器数的形式值就不等于真正的数值。

例如上面的有符号数 1000 0011,其最高位1代表负,其真正数值是 -3,而不是形式值131(1000 0011转换成十进制等于131)。所以,为区别起见,将带符号位的机器数对应的真正数值称为机器数的真值

例:0000 0001的真值 = +000 0001 = +1,1000 0001的真值 = –000 0001 = –1

4.2 原码, 反码, 补码

让我们先了解原码、反码和补码的概念。对于一个数,计算机要使用一定的编码方式进行存储,原码、反码、补码是机器存储一个具体数字的编码方式。

4.2.1 原码

**原码就是机器数,**即用第一位表示符号,其余位表示值。比如:如果是8位二进制:

[+1]原= 0000 0001

[-1]原= 1000 0001

第一位是符号位,因为第一位是符号位,所以8位二进制数的取值范围就是:(即第一位不表示值,只表示正负。)

[1111 1111 , 0111 1111] 即 [-127 , 127]

原码是人脑最容易理解和计算的表示方式。

4.2.2 反码

  • 正数的反码是其本身;

  • 负数的反码是在其原码的基础上,符号位不变,其余各个位取反。

[+1] = [0000 0001]原 = [0000 0001]反

[-1] = [1000 0001]原 = [1111 1110]反

可见如果一个反码表示的是负数,人脑无法直观的看出来它的数值。通常要将其转换成原码再计算。

4.2.3 补码

  • 正数的补码就是其本身;

  • 负数的补码是在其原码的基础上,符号位不变,其余各位取反,最后+1。(也即在反码的基础上+1)

[+1] = [0000 0001]原 = [0000 0001]反 = [0000 0001]补

[-1] = [1000 0001]原 = [1111 1110]反 = [1111 1111]补

对于负数,补码表示方式也是人脑无法直观看出其数值的。通常也需要转换成原码再计算其数值。

4.3 为何要使用原码、反码和补码

在数学中 1 + (-1) = 0,如果使用原码直接参与数学运算,00000001 + 10000001 = 10000010(换算成十进制为 -2),显然不对。所以原码的符号位不能直接参与运算,必须和其他位分开,这就增加了硬件的开销和复杂性。为了便于 ALU (算术逻辑单元,实现多组算术运算和逻辑运算的组合逻辑电路)的设计,又发展出反码、补码。

于是人们想出了将符号位也参与运算的方法。我们知道,根据运算法则减去一个正数等于加上一个负数,即:1-1 = 1 + (-1) = 0, 所以机器可以只有加法而没有减法,这样计算机运算的设计就更简单了。

我们以计算十进制表达式:1 - 1 = 0为例

首先来看原码:

1 - 1 = 1 + (-1) = [0000 0001]原+ [1000 0001]原= [1000 0010]原= -2

如果用原码表示,让符号位也参与计算,显然对于减法来说,结果是不正确的。这也就是为何计算机内部不使用原码表示一个数。

为了解决原码做减法的问题, 出现了反码:

1 - 1 = 1 + (-1) = [0000 0001]原+ [1000 0001]原= [0000 0001]反+ [1111 1110]反= [1111 1111]反= [1000 0000]原= -0

发现用反码计算减法,结果的真值部分是正确的。而唯一的问题其实就出现在"0"这个特殊的数值上,虽然人们理解上**+0和-0**是一样的,但是0带符号是没有任何意义的,而且会有[0000 0000]原和[1000 0000]原两个编码表示0。

于是补码的出现,解决了0的符号问题以及0的两个编码问题:

1-1 = 1 + (-1) = [0000 0001]原+ [1000 0001]原= [0000 0001]补+ [1111 1111]补= [1 0000 0000]补=[0000 0000]补=[0000 0000]原注意:进位1不在计算机字长里。

这样0用[0000 0000]表示,而以前出现问题的-0则不存在了。而且可以用[1000 0000]表示-128:-128的由来如下:

(-1) + (-127) = [1000 0001]原+ [1111 1111]原= [1111 1111]补+ [1000 0001]补= [1000 0000]补

-1-127的结果应该是-128,在用补码运算的结果中,[1000 0000]补就是-128,但是注意因为实际上是使用以前的-0的补码来表示-128,所以-128并没有原码和反码表示。(对-128的补码表示[1000 0000]补,算出来的原码是[0000 0000]原,这是不正确的)

使用补码,不仅仅修复了0的符号以及存在两个编码的问题,而且还能够多表示一个最低数。这就是为什么8位二进制,使用原码或反码表示的范围为[-127, +127],而使用补码表示的范围为[-128, 127]。

整数的存储是将十进制为的整数转换成其相应的补码后存储。

5. 小数的存储方式

现如今的计算机中浮点数的存储都是遵循IEEE754/854标准,以二进制的科学计数法存放到内存中。

对于浮点数在计算机中有两种存储的精度,即单精度和双精度,单精度是32位,双精度是64位。

float 的内存分布符号位(1Bit)指数部分(8 Bits)尾数部分(23 Bits)
double 的内存分布符号位(1Bit)指数部分(11 Bits)尾数部分(52 Bits)
  • 符号S:0为正,1为负
  • 尾数M:小数点后面的部分
  • 指数E:即阶码,指明了小数点在数据中的位置
    • 为了让指数表示正、负引入了偏差码,float的为127,double的为1024

十进制小数转二进制小数

  • 先把整数部分转化为二进制
  • 再把小数部分转化为二进制(用2乘以小数部分,每次将结果整数取出,然后用剩余小数部分继续乘以2,直到小数部分为零,或者达到要求的精度为止)

以float f = 5.25为例

整数部分:5 -> 101

小数部分:0.25 -> 0.01

0.25 * 2 = 0.5  --- 0
0.5  * 2 = 1.0  --- 1  
从上往下取值:0.01    

最后结果:101.01 = 1.0101 * 22

可见指数实际值为2,加上偏差码127,2 + 127 = 129,129的二进制为10000001B,因此不难得到,8.25在内存中的存储情况为:

SEM
01000 00010101 0000 0000 0000 0000 000

如果把这个值作为整型使用,将是一个很大的数字,是1084751872

把这个内存里面的值转为十进制小数就很简单了:

// 1.首先判断S表示的正负      +
// 2.计算出E实际表示的指数   1000 0001 = 129    129 - 127 = 2
// 3.根据M写出二进制小数形式  1.0101 * 2^2  = 101.01
// 4.对二进制小数以小数点为界限开始编号
210 -1-2 编号
101. 0 1 B
1*2^2 + 0 + 1*2^0 + 0*2^(-1) + 1*2^(-2) = 4 + 1 +  0.25 =5.25   

注意:

  • 在二进制,第一个有效数字必定是“1”,因此这个“1”并不会存储。
  • 浮点数不能精确表示其范围内的所有数。
  • 可精确表示的数不是均匀分布的,越靠近0越稠密。

验证测试代码

#include <stdio.h>

int main(){
	float f = 5.25f;
	unsigned int *p = (unsigned int*)&f;
	printf("%d\n%#x\n", *p, *p);
	return 0;
}

运行截图:
在这里插入图片描述

文章来源:https://blog.csdn.net/weixin_43344151/article/details/135633342
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。