目录
一、什么是程序替换
1.1程序替换的原理
用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序替换,从新程序的启动例程开始执行。调用exec并不创建新进程,所以调用exec前后该进程的id并未改变。
就相当于在执行一个程序时,要从磁盘中将新的数据和代码加载到内存中,将老程序的数据和代码替换掉,这个现象就叫做程序替换。程序替换过程中并没有创建新的进程,而作为用户我们没有资格去直接进行程序替换,所以如果想实现程序替换,就必须使用系统调用execl。
即pcb这个内核数据结构不换,代码和数据换了。
第一个参数*Path是要寻找的程序,第二个参数*arg表示你想如何执行,而最后的...是可变参数列表。
我们可以通过这个指令来对ls指令进行模拟。
可以看到 ls命令很顺利的执行了,可pccontrol.c最后一个一个printf却没有执行,这是为什么呢?
答案很简单,因为程序被替换了。
execl只有失败返回没有成功返回。 比如给定一个不存在的路径。此时执行完毕后如果去echo $?就可以看到错误码为1。如果成功替换完成,不创建新的进程。
而我们创建一个进程,是先创建PCB、地址空间、页表,然后再把程序加载到内存,而程序替换所做的工作就是加载。
1.2更改为多进程版本
我们也可以创建一个子进程,让子进程去进行程序替换,这样父进程就可以得到运行结果,因为进程具有独立性,创建子进程后,当要让子进程去进行程序替换时就会发生写实拷贝,开辟新的空间,这样就不会影响父进程。
所以我们的shell运行原理我们也可以类推出来,当我们在shell中输入指令时,就会创建一个子进程,然后shell去wait等待子进程,子进程进行程序替换发生写时拷贝开辟新的空间,然后去执行。
二、各种exe接口
我们可以看到,一共有6个接口, 加上execv一共有7个接口。
2.2execlp
execlp,最后为p(PATH)的不需要告诉操作系统绝对路径,只需要告诉文件名。系统进行替换时会自动去PATH环境变量中查找。
最后的执行结果和execl是一样的 。
2.2execv
第一个参数是绝对或相对路径,第二个参数是argv,即命令行参数表,类似于main函数的参数。
而exec结尾为l表示list,即将元素以链表的形式传。
而v结尾表示vector,即以数组形式传。
execvp类比于上面的execlp
exec*可以执行系统的指令,也可以执行自己的程序,无论是什么语言,都可以在linux下跑。因为所有的语言运行之后都是进程。
2.3execle、execve、execvpe
这些函数原型看起来很容易混,但只要掌握了规律就很好记。
l(list) : 表示参数采用列表
v(vector) : 参数用数组
p(path) : 有p自动搜索环境变量PATH
e(env) : 表示自己维护环境变量
区别就是最后带上了环境变量的一个参数。
首先如果不使用带环境变量的调用,可以通过显示传的方式传给操作系统。我们也可以在C语言写的程序中去通过传参给一段C++ 代码编译成的可执行程序。
通过以上我们可以看到,通过子进程完成了进程切换成功运行了mytest文件并且将命令行参数传给了mytest的argv,父进程也成功回收了子进程。
以上传了命令行参数,那环境变量该如何传给要替换的程序呢?
当我们不显示去传环境变量表时会发生什么呢?
子进程默认可以通过地址空间继承的方式,让所有子进程拿到环境变量。
进程程序替换,不会替换环境变量数据。
1.如果我们想让子进程继承全部的环境变量,直接就能拿到
2.如果单纯新增的话使用putenv("GA=AAAAAA");
3.如果想设置全新的环境变量,就可以用到execle
再次运行,环境变量就变成我们设置的全新的环境变量了,也叫覆盖方式。
而这么多的接口功能上基本上不存在太大的差异,只是传参的区别以及使用方式不同,而程序替换真正的系统调用只有一个,就是上图所示的execve,其余所有的调用都是封装了execve。