翻译环境和运行环境
在ANSI C的任何一种实现中,存在两个不同的环境
.第一种是翻译环境,在这个环境中源代码被转换为可执行的机器指令
.第二种是执行环境,它用于实际执行代码
翻译环境是由编译和链接两个大过程组成,而编译又可以分解成:预处理(预编译)、编译和汇编三个过程
.多个c文件单独经过编译处理产生对应的目标文件
.在Windows环境下目标文件的后缀.obj,Linux环境下目标文件下的后缀是.o
.多个目标文件和链接库一起经过链接器处理生成最终的可执行程序
.链接库是指运行时库(它是支持运行的基本函数集合)或者第三方库?
程序执行的过程:
① 一般来说,程先是被操作系统载入系统中。在独立的系统中,程序的载入叶可能是通过可执行代码置入只读内存来完成。
② 程序运行开始,接着便调用main函数。
③ 操作系统开始执行程序代码。这个时候程序将使用一个运行时堆栈,用来存储函数的局部变量和返回地址。程序同时也可以使用静态内存,存储与静态内存中的变量在程序的整个执行过程中一直保留它们的值。
④ 终止程序。操作系统正常终止main函数,也有可能是意外终止的。
主要用来进行一些文本操作
将源文件和头文件处理成.i为后缀的文件
处理命令:gcc -E test.c -o test.i? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (gcc环境下)
在这个阶段主要处理源文件中一些预编译指令:#include? ? ? ? #define
处理规则:
.将所有的#define删除,并展开所有的宏定义
.处理所有的条件编译指令,如:#if、#ifdef、#elif 、#else、#endif
.处理#include预编译指令,将包含的头文件的内容插入到该预编译指令的位置。这个过程是递归进行的,也就是说包含的头文件也可能包含其他文件
.删除所有的注释
.添加行和文件标识,方便后续编译器生成调试信息等
.或保留所有的#pragma的编译器指令,编译器后续会使用
编译就是将C语言代码翻译成汇编代码的过程,经过词法分析、语法分析、语义分析及优化
编译指令:gcc -S test.i -o test.s
汇编器是将汇编代码转变成可执行代码,将每一汇编语句几乎都对应一条机器指令。就是根据汇编指令和机器指令的对照表进行一一翻译,也不能做指令优化。
gcc -c test.s -o test.o?
链接是一个复杂的过程,链接的时候需要把一堆文件链接在一起才生成可执行程序。
链接的主要过程包括:地址和空间分配,符号决议和重定位等这些步骤。
链接解决的是一个项目中多文件、多模块之间互相调用的问题。
1.__FILE__? ? ? ? //进行编译的源文件
2.__LINE__? ? ? ? //文件当前的行号
3.__DATE__? ? ? ?//文件被编译的日期
4.__TIME__? ? ? ? //文件被编译的时间
5.__STDC__? ? ? ? //如果编译器遵循ANSI C,其值为一,否则未定义
#define name stuff? ? ? ? ? ? ? ? ? ? ? ?
例子:#define N? ?10(末尾不加;)?
#define机制包括了一个规定,允许把参数替换到文本中,这种实现通常称为宏(macro)或定义宏(define macro)
#define name (parament_list) stuff? ? ? ? ??//parament_list是一个符号隔开的符号表,它们可能出现在stuff中
?例子:#define SQUARE(x)? ? ? x*x
但是定义宏存在一个问题:
#define N? ? ? 5
……
printf("%d\n",SQUARE(N+1));
上面代码输出的是11而不是36,这是为什么?其实定义宏只是简单的对数据进行直接替换并不会进行运算,所以变成5+1*5+1=11。宏的这种特性就会使操作符的优先级会影响宏的值,所以必要的括号需要添加,如SQUARE(x)? ? ? (x)*(x)就能避免上述的情况。??
1.在调用宏,首先对参数进行检查,看看是否包含任何由#define定义的符号。如果是,它们首先被替换。
2.替换文本随后被插入到程序中原来的文本位置。对于宏,参数名被它们的值所替换。
3.最后,再次对结果文本进行扫描,看看它是否包含任何由#define定义的符号。如果是,就重复上述处理过程。
注意:
1.宏参数和#define定义中可以出现其他#define定义的符号。但是对于宏,不能出现递归
2.当处理器搜索#define定义的符号的时候,字符串常量的内容并不被搜索
1.实际在执行小型计算工作时,宏比函数在程序规模和速度方面更胜一筹
2.其次,函数的参数必须声明其特定的类型,而宏的参数是无类型的
与函数相比的劣势:
1.每次使用宏的时候,一份宏的定义的代码将插入到程序中。除非宏比较短,否则可能大幅度增加程序的长度
2.宏是没办法进行调试的,也没办法递归
3.宏由于与类型无关,也就不够严谨
4.上面讲到操作符的优先级可能会影响宏的值,导致程序出错
用于移除一个宏定义
#undef? name//在该语句下面所移除的宏将不能再被使用
它是将宏的一个参数转换为字符串字面量,它仅允许出现在带参数的宏替换列表中
代码演示:int n=10;
#define? ? ? ? PRINT(n)? ? ?printf("#n=%d",n)? ? ? ? //n=10(第一个n不会转换为数值)
它可以将它两边的符号合并为一个符号
#define? ? ?M(str1,str2)? str1##str2
……
printf(“%s\n”,M(stu dent));//预处理后宏会被替换成student
?在编译一个程序的时候我们如果要将一条语句(一组语句)编译或者放弃是很方便。因为我们有条件编译指令。
常见的条件编译指令:
1.
#if? ? 常量表达式
? ? ? ? ? ? ? ? //....
#endif
//常量表达式由预处理器求值(如用#define定义? ? ? ? ? ? ? ? ?#define? __DEBUG__)
2.多分支的条件编译
#if? ? 常量表达式
? ? ? ? ? ? ? ? //....
#elif? 常量表达式
? ? ? ? ? ? ? ? //....
#else
? ? ? ? ? ? ? ? //....
#endif
3.判断是否被定义
#if? ?define(symbol)
#ifdef symbol
?
#if !defined(symbol)
#ifndef? ?symbol
?
4.嵌套指令
#if defined(OS_UNIX)
? ? ? ? ? ? ? ? #ifdef? OPTION1
? ? ? ? ? ? ? ? ? ? ? ? unix_version_option1();
? ? ? ? ? ? ? ? #endif
? ? ? ? ? ? ? ? #ifdef? OPTION2
? ? ? ? ? ? ? ? ? ? ? ? unix_version_option2();
? ? ? ? ? ? ? ? #endif
#elif? defined (OS_MSDOS)
? ? ? ? ? ? ? ? #ifdef? OPTION2
? ? ? ? ? ? ? ? ? ? ? ? msdos_version_option2();
? ? ? ? ? ? ? ? #endif
#endif
#include "game.h"
查找方式:先在源文件所在目录下查找,如果未找到,编译器就像查找库函数头文件一样在标准库位置查找头文件,如果还是找不到就提示编译错误。
#include<game.h>//这里的头文件只是举例演示,并不是代表真的有这个头文件?
查找方式:直接去标准路径下去查找,如果找不到就提示编译错误。
如果在一个程序中一个头文件被包含了很多次,那么同时也就会编译多次。这会使编译的压力大大增加。所以有办法可以避免头文件被重复引入呢?这就可以使用我们上文提到的条件编译。
#ifdef __TEST_H__
#define __TEST_H__
? ? ? ? //引入头文件
#endif??
或者也可以使用#pragma once来解决?
以上就是对于C语言编译和链接的内容,篇幅有点长,希望对看到的小伙伴有帮助。