【王爽老师汇编语言】os和计组必备前置知识-学习记录2

发布时间：2023年12月28日

1. 应用程序的组成

从汇编语言角度，一个程序分为：

数据段
堆栈段
代码段
扩展段

应用程序从高级语言的角度比如C语言分段：
数据段
代码段
BSS段
栈、堆

我们可以看到一个可执行程序至少包含：代码段+数据段+BBS段
一般情况下，一个可执行二进制程序（在 linux 下为一个进程单元），在存储时（没有加载到内存运行），至少拥有三个部分，分别是代码段(text)、数据段(data)、和BSS 段。

这三个部分一起组成了可执行程序（可能还有其他的段，和平台相关）

当应用程序运行时（运行态），此时需要另外两个域：堆和栈。正在运行的程序：代码段 + 数据段 + BSS 段 + 堆 + 栈。

应用程序存储态和运行态

如图所示为可执行应用程序存储态和运行态的结构对照图。一个正在运行的 C 程序占用的内存区域分为代码段、数据段（初始化数据）、BSS 段（未初始化数据）、堆和栈 5 部分
在这里插入图片描述

3 各段说明

3.1 代码段
代码段在内存中被映射为只读。它是由编译器在编译链接时自动计算的。通常是用来存放程序执行的指令。代码段输入静态内存分配。

3.2 数据段
通常用来存放程序中已初始化的（非 0）全局变量和静态局部变量。数据段的起始位置由链接定位文件确认，大小在编译链接时自动分配。数据段属于静态内存分配

3.3 BSS 段
bss 是英文 Block by Symbol 的简称。通常用来存放程序中未初始化和初始化为 0的全局变量的一块内存区域，在程序载入时由内核清零。数据段属于静态内存分配

3.4 堆
堆保存函数内部动态分配（malloc 或 new）的内存，是另外一种用来保存程序信息的数据结构。

堆是先进先出（FIFO）数据结构。堆的地址空间是向上增加，即当堆上保存的数据越多，堆的地址越高。动态内存分配

注意：堆内存需要程序员手动管理内存，通常适用于较大的内存分配，如频繁的分配较小的内存，容易导致内存碎片化。

3.5 栈
栈保存函数的局部变量（不包括 static 修饰的变量），参数以及返回值。是一种后进先出（LIFO）的数据结构。

在调用函数或过程后，系统会清除栈上保存的局部变量、函数调用信息及其他信息。

栈的另外一个重要特征是，它的地址空间向下减少，即当栈上保存的数据越多，栈的地址越低。静态内存分配

注意，由于栈的空间通常比较小，一般 linux 程序只有几 M，故局部变量，函数入参应该避免出现超大栈内存使用，比如超大结构体，数组等，避免出现 stack overflow

4.补充

一般情况，一个程序本质上都是由 bss段、data段、text段三个段组成——这是计算机程序设计中重要的基本概念。而且在嵌入式系统的设计中也非常重要，牵涉到嵌入式系统运行时的内存大小分配，存储单元占用空间大小的问题。

在采用段式内存管理的架构中（比如intel的80x86系统），bss段（Block Started by Symbol segment）通常是指用来存放程序中未初始化的全局变量的一块内存区域，一般在初始化时bss 段部分将会清零（bss段属于静态内存分配，即程序一开始就将其清零了）。

比如，在C语言程序编译完成之后，已初始化的全局变量保存在.data 段中，未初始化的全局变量保存在.bss 段中。

text段: 用于存放程序代码的区域，编译时确定，只读。更进一步讲是存放处理器的机器指令，当各个源文件单独编译之后生成目标文件，经连接器链接各个目标文件并解决各个源文件之间函数的引用，与此同时，还得将所有目标文件中的.text段合在一起，但不是简单的将它们“堆”在一起就完事，还需要处理各个段之间的函数引用问题。

在嵌入式系统中，如果处理器是带MMU（MemoryManagement Unit，内存管理单元），那么当我们的可执行程序被加载到内存以后，通常都会将.text段所在的内存空间设置为只读，以保护.text中的代码不会被意外的改写（比如在程序出错时）。当然，如果没有MMU就无法获得这种代码保护功能。

data段 :用于存放在编译阶段(而非运行时)就能确定的数据，可读可写。也是通常所说的静态存储区，赋了初值的全局变量、常量和静态变量都存放在这个域。

而bss段不在可执行文件中，由系统初始化。

关于data和bss段更详细的区别我们不妨用下面2段小程序说明一下

程序1:

int ar[30000];

void main()

{

…

}

程序2:

int ar[300000] = {1, 2, 3, 4, 5, 6 };

void main()

{

…

}

发现程序2编译之后所得的可执行文件比程序1大得多。

为什么？

区别很明显，程序1位于bss段，程序2位于data段，两者的区别在于：

全局的未初始化变量存在于bss段中，具体体现为一个占位符，全局的已初始化变量存于data段中，而函数内的自动变量都在栈上分配空间。

bss不占用可执行文件空间，其内容由操作系统初始化（清零），裸机程序需要自行手动清零。

而data段则需要占用可执行文件空间，其内容由程序初始化，因此造成了上述情况。

注意：

bss段（未手动初始化的数据）并不给该段的数据分配空间，只是记录数据所需空间的大小。

data段（已手动初始化的数据）为数据分配空间，数据保存在目标文件中。

data段包含经过初始化的全局变量以及它们的值。

BSS段的大小从可执行文件中得到，然后链接器得到这个大小的内存块，紧跟在数据段后面。当这个内存区进入程序的地址空间后全部清零，包含data和bss段的整个区段此时通常称为数据区。

文章来源:https://blog.csdn.net/weixin_40293999/article/details/135271958
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！