文章目录
一,程序的翻译环境和执行环境
二,编译和链接
1,翻译环境
2,预处理
前言
这里将深入低层取了解我们电脑的程序环境的建立和预处理
内容
一,程序的翻译环境和执行环境
在ASNSI C(国际标准C)的任何一种实现中存在两个不同的环境
1,翻译环境:这个环境中的源码转换为可执行的机械指令(二进制指令)
2,执行环境:这个环境是用于执行代码
二,编译与链接
大致过程
对于一个企业的分工,往往是以多个源文件进行分工的
链接库就是依赖项,比如我们在开头所做的预处理,如#include<stdio.h>
这里需要注意,只要源文件单独处理就会生成obj文件,在window是.obj,在Linux是.o ,以上是程序的编译过程
详细分析
分为这几个过程,接下来我们来分析这几个过程
1,预处理(vs2022环境)
我们来执行一个程序
cpp
#include<stdio.h>
int add(int x, int y) {
return x + y;
}
int main() {
int a[4] = { 1,2,3,4 };
for (int i = 0;i < 4;i++) {
printf("%d", a[i]);
}
int g_val = add(4, 5);
printf("%d", g_val);
}
这个是我们的源文件(.cpp文件),那么我们要经历第一步预处理,我们用vs2022执行预处理,会生成一个.i文件,这个.i文件就我们预处理执行完成之后所出来的文件,那么预处理会做一些什么东西呢?
作用一:文件的插入(文件的包含)
当你打开你的.i文件之后,你会发现这里有你的代码还有上面一大坨的代码,那么这上面一大坨的代码是什么东西呢?你会发现这个.i文件没有了你之前写的预处理了,那么有没有可能是把预处理的文件插入进来了呢?我们取看看stdio.h文件里面的东西取验证一下
是stdio.h文件里面的
这个是.i文件里面的
那么预处理是把这个stdio.h文件插入进来了
作用二:文本的替换
我们在程序中多加一个宏定义
cpp
#include<stdio.h>
#define MAX 100
int add(int x, int y) {
return x + y;
}
int main() {
int a[4] = { 1,2,3,4 };
for (int i = 0;i < 4;i++) {
printf("%d", a[i]);
}
int g_val = add(4, 5);
printf("%d", g_val);
int a = MAX;
printf("%d", a);
}
我们来看我们的.i文件
我们会发现这个宏定义没有了,而且.i文件里面的MAX被替换了,被替换为100了
作用三:注释的消除
cpp
#include<stdio.h>
#define MAX 100
int add(int x, int y) {
return x + y;
}
/*随便加的注释*/
int main() {
int a[4] = { 1,2,3,4 };
for (int i = 0;i < 4;i++) {
printf("%d", a[i]);
}
int g_val = add(4, 5);
printf("%d", g_val);
int a = MAX;
printf("%d", a);
}
我们在中间随便加一个注释来看看.i文件会怎么样
我们打开这个.i文件这个注释是被消除的
(注:vs是可以选择保留注释的,但是一般我们的编译器都是会消除的注释的)
以上是我列出的三个常用的
根据我们所写的代码可以总结预处理的作用就是把别人的文件通过#include<>包含起来,这样才可以正常运行,此外还有注释的删除,宏定义的文本替换等一系列操作
总结:预处理基本都是进行文本操作
2,编译
编译为.s文件
编译的作用就是把预处理之后的文件转换为汇编代码(这里面的转化十分复杂)
转化的过程:语法分析,词法分析,符号汇总,语义分析
语法分析,词法分析:把每一个语句都进行逐个的分析,如
int a = 10 ;类型名字 变量名 运算符号 值,这个就是语法分析
符号汇总是最重要的,其他三个交给计算机就好,我们这里要了解这个符号汇总
把全局的符号进行汇总
cpp
#include<stdio.h>
#define MAX 100
int add(int x, int y) {
return x + y;
}
//随便加的注释
int main() {
int a[4] = { 1,2,3,4 };
for (int i = 0;i < 4;i++) {
printf("%d", a[i]);
}
int g_val = add(4, 5);
printf("%d", g_val);
int a = MAX;
printf("%d", a);
}
比如我们之前写的代码,这里面就会把MAX,main,Add汇总起来
为什么要汇总呢?这里会与链接扯上关系,另外就是跟作用范围有关系,因为Add main MAX的作用域为全局范围,但是里面的数组a还有g_val这些都是局部变量,作用范围也就局限于那一块函数,我们把相互影响的都汇总起来
语义转换就是转化为汇编语言
3,汇编
汇编的文件是.o或者.obj文件
这里的作用有两个1,把汇编语言转换为二进制语言 2,形成符号表
我们之前不是在编译的时候进行了符号汇总吗?这里刚好就用上了
情况一:Add和main在同一个.cpp文件里面
我们之前进行符号汇总,这里就是给这些符号进行分配地址,这里的地址我是随便写的
情况二:main和Add不在用一个.cpp文件里面
这里会给Add分配一个无效的地址,在后面的链接里面再进行处理
编译的过程就是.i-->.s--->.obj这三个步骤,每一个步骤都有自己自己重要的步骤
对于我们目前来看预处理所有的都很重要,编译主要是符号汇总,汇编主要是生成符号表
4,链接
文件的格式为.elf格式
作用:1,合成段表 2,符号表的重定位
1,合成段表
再我们进行每一个文件的处理的时候,都是有自己独特的文件处理格式,elf就是把这个o或者obj文件分为一段一段的进行链接
就像这样,进行玩链接放入到.exe文件就可以用了
2,符号表的重定位
我们之前不是不同源文件下的只会给一个无效的地址吗?那么这里就会重新定位,赋予Add一个有效的地址
一般我们如果重定义了相同的函数名字就会出现这链接错误,就是因为符号表里面有两个,系统不知道选择哪一个,这样就会出错,但是这里不考虑c++的重载问题
运行环境可以去看我写的函数栈帧这里对于这个运行写的很详细
1,大概就是把程序载入到内存里面,一般由操作系统完成,但是在独立的环境中,我们基本都是需要手动完成
2,程序的执行便开始,找到main函数
3,开始执行程序的代码,这个时候使用运行时候的栈堆,存储函数的局部变量和返回值
4,终止程序,正常终止程序或者意外终止程序
三,预处理详解
预定义的符号
__FILE__
:当前源代码文件的文件名,类型为字符串常量。__LINE__
:当前源代码的行号,类型为整数。__DATE__
:当前编译的日期,类型为字符串常量(格式:"Mmm dd yyyy")。__TIME__
:当前编译的时间,类型为字符串常量(格式: "hh:mm:ss")。__STDC__
:如果遵循 ANSI C 标准,则该宏会被定义,值为 1。可以用来检测编译器是否支持标准 C。__GNUC__
:GNU 编译器(GCC)的版本信息。
扩展:文件的学习
cpp
int main() {
int i = 0;
FILE* pf = fopen("xxxxx", "w");
if (pf == NULL) {
perror("fopen");
return EXIT_FAILURE;
}
fprintf(pf, "xxxx", xxxx);
fclose(pf);
pf = NULL;
return 0;
}
这里就是对于文件打开和打印和关闭,注意这个后面指针使用完一定要关闭文件
#define的使用
这个是可以定义这个数字,一句话,语句代码都是可以的
cpp
#define MAX 100
#define STR "hello bit"
#define PRINT printf("Hello wrold");
这几种都是可以的,在我们程序使用的时候
#define定义宏
#define机制包括了一个规定,允许把参数替换到文本中,这个实现通常称为宏和定义宏
注意事项:
#define name(parament-list) stuff
1,参数列表的左括号必须和name紧邻
2,如果两者之间有任何空白存在,参数列表就会被解释为stuff
比如#define SQUAFE(x) x*x
这里就是这里把x解释为x*x,然后把x的值放进去,假如放的是5,则这里解释的时候变成5*5,这可以知道这个宏就是一个替换
在定义宏的时候,我们不要吝啬括号,比如
我们这里算出来的是21,但是我们要的得到的答案并不是这个,它究竟怎么进行了计算呢?就是10+1*1+10,变成这样进行计算,所以才导致我们会计算错误,所以我们不要吝啬括号,就可以减少错误
#define宏的定义规则
1,首先对参数进行检查,看是否有可以用define替换的参数,进行文本替换
2,替换完成之后,就开始进行宏的参数替换
3,最后在进行把宏插入到对应的位置,这样就完成了
注:
1,宏是不可以出现递归的
2,当预处理器收索#define定义的符号的时候,字符串常量的内容并不收索,这个是什么意思呢?如这样
cpp
#define MAX 100
int main() {
printf("MAX");
}
这里就是不会对这个MAX进行文本替换
牛逼的知识:
我们用这个多个""来进行书写,这是可以打印出来的,那么我们就可以理解#的作用了
我们可以看到这个#就是把这个zhang给转成了一个字符串
##的作用是把两个连起来
下面有个扩展到有写
宏和函数的区别
优点
1,对于小型计算是更加的方便,并且时间很快,运用函数的话就是会拖慢运行时间
2,参数是无类型的,所以十分的方便
缺点
1,宏是没有办法debug的
2,每一次定义宏都是需要插入的,会增大代码的长度,会出现代码累赘,除非代码很短
3,无类型是不严谨的,但可以强制转换,但是也会破坏这个内存的管理
4,容易带来优先级别的问题
使用技巧:
#define MALLOC(num,type)(type*)malloc(num*sizeof(type))
用这个,我们就可以不用每一次写那么长的代码了
include的<>和""的区别
这个<>是直接去库里面进行寻找
""是去当前文件查找,然后没有找到去库里面寻找
总结
预处理:有头文件的插入,文本的替换,注释的删除的一系列动作
编译:语法分析,词法分析,符号汇总,转成汇编语言
汇编:汇编语言转成二进制语言,制作符号表
链接:链接段表,重新定位符号表
预处理的符号里面有很多是获取文件的名字时间等等,这个可以与eaxyx的loadimage来进行联合使用
还有就是define的使用了和宏了,这个使用就是简单的文本替换,这个宏是为了使我们的代码更见便捷而且还可以提高算法的速度在小型的计算的时候