一:程序的翻译环境和执行环境
在 ANSI C 的任何一种实现中,存在两个不同的环境。
第 1 种是翻译环境,在这个环境中源代码被转换为可执行的机器指令。
第 2 种是执行环境,它用于实际执行代码
也就是说:↓
**1:翻译环境:**代码->二进制指令
**2:执行环境:**执行二进制指令
**Q:**我们写的代码是文本信息,而计算机执行的是二进制的指令,这二者之间如何进行的转换?
换句话说就是:翻译环境中发生了什么,才让代码->二进制指令?
解释: 我们写代码的文件叫作.c源文件,会经过编译器生成目标文件(不同环境和编译器的目标文件不同,比如VS是.obj,Linux环境下的gcc是.o),然后最后通过链接器把目标文件和链接库进行链接生成可执行程序。
这是一个在VS上写代码到生成可执行程序的过程,编译器为我们做了很多,才让我们能从源文件一下到目标文件,所以博主选择在Linux环境下的gcc编译器下进行细节上的演示,才能清楚的知道翻译环境到底发生了什么。
二:翻译环境工作图
解释:翻译环境分为四步
1:预编译(也叫作预处理)
2:编译
3:汇编
4:链接
三:翻译环境工作的展示
前提准备:
源文件创建及代码书写:
①:
我们创建一个在gcc中创建一个class110目录,在其下创建一个源文件test.c,在里面写上如图所示的代码
第一阶段:预编译
①: 然后在终端对test.c这个源文件进行gcc -E -o test.i(-E代表执行完预编译阶段就停止,然后放在test.i这个文件)
**②:**此时生成了test.i这个文件
**③:**将test.i和test.c进行对比
解释:
将test.i和test.c进行对比,我们能发现了第一阶段预编译的作用:
**1:**注释的删除
**2:**头文件的包含(test.i前面的800+行,就是#include<stdio.h>的内容)
3:#define符号的替换(直接把M替换成了100)
总结:所有的预处理指令(如文件包含、宏定义、条件编译等)都是在预编译阶段完成的。
这些统称为文本操作
第二阶段:编译
①:gcc -S test.i(对test.i进行 -S(执行完第二阶段编译就停止)放进自动生成的test.s中)
**解释:**此时打开test.s发现全是汇编代码, 所以第二阶段的工作是:将代码翻译成汇编代码,放进了自动生成的test.s中
第三阶段:汇编
①:gcc -c test.c(执行完第三阶段汇编就停止,放进自动生成的目标文件test.o中)
**②:**打开test.o,被警告
**解释:**打开test.o发现其是二进制文件,所以该阶段的功能:将汇编指令翻译成了二进制指令
③:强行打开目标文件test.o
**解释:**ELF是一种文件的格式 ,需要用指令readelf来读取ELF格式的文件
**④:**用指令readelf来读取ELF格式的文件
**解释:**此时返现我们需要输入一些选项(-a,-h,-l.......)来进行选择性的查看
**⑤:-**a选项,查看到段表
**解释:**这就是段表,也就是说ELF这种文件格式,其实是按照一个一个的段来存储的,这也是第四阶段链接中的功能合并段表中所谓的段表
⑥:-s来查看符号表
解释:
**1:**此时发现符号表中有我们代码的全局变量g_val,函数Add,函数main,库函数printf
**2:**这些都被存储到了符号表中 ,这就是第三阶段汇编的另一个作用,形成符号表,那么符号表是做什么的?在第四阶段里面有作用
第四阶段:链接
①:gcc test.o -0 test(链接生成可执行程序test)
②:打开可执行程序test
**解释:**可执行程序test依旧是一个二进制文件,也是可以用ELF打开的
四:链接的功能讲解:
①:假设两个.c源文件
**解释:**一个.c只是声明了Add函数,一个.add有函数的定义
②:链接的功能
解释:
**1:**每个源文件都在编译阶段 进行了符号汇总,然后在汇编阶段进行了形成符号表,即函数和对应的地址进行合并形成符号表(test.c的 Add是声明,所以地址是无效的)
**2:**在链接进行合并符号表,把两个源文件的符号表进行合并
**3:**Add的地址确认为有效地址(add.c中的函数地址)就叫作符号表的重定位