前言:本章重点
①:学习进程的创建,fork/vfork
②:学习进程终止,认识$
③:学习进程等待
④:写一个微型的shell(单独列一章),重新认识shell运行原理
一、进程创建
1.1 fork函数初识
在Linux中,fork函数是非常重要的函数,它从已创建的进程中创建一个新进程,新进程为子进程,而原进程为父进程

返回值:子进程返回0,父进程返回子进程的id,出错子进程不会被创建,父进程会得到返回值-1
现在产生了下面几个问题:
1.为什么要给子进程返回0,父进程返回子进程的pid?
这样的设计是为了父子进程能明确自己的身份,同时满足进程间管理的核心需求,具体原因有下面两点:
**①:给子进程返回0,**子进程不需要知道自己的pid,它可以通过getpid()自己获取在需要的时候,但需要明确"我是子进程",返回0是一个简单的身份标识,让子进程判断自己的身份,执行对应的逻辑
②:给父进程返回子进程的pid,父进程需要管理子进程(wait()/waitpid()等待子进程结束,回收资源),而PID是系统中进程的唯一标识,所以父进程必须要拿到子进程的PID,才能对特定子进程进行操作(多个子进程时,父进程需要知道具体等哪一个)
总结:子进程的需求:我是不是子进程,返回0表示是,父进程的需求:我的子进程是谁,返回子进程PID表示这是你要管理的子进程
2.为什么一个函数fork会有俩个返回值?
这是因为fork()执行后会"复制进程",导致同一个函数调用在两个独立的进程中分别返回,本质是"进程分裂"带来的结果:
①:先尝试创建一个与当前进程(父进程)完全相同的副本(子进程,包含代码、数据、堆栈等)
②:若成功,父进程和子进程会同时从fork()的下一行代码继续执行
所以fork()的两个返回值其实是:父进程的fork()调用返回子进程的PID,子进程的fork()调用返回0,相当于一个函数调用被两个进程各自执行了返回操作,所以看起来有两个返回值
3.为什么一个id既等于0,又大于0?
这是对进程空间独立性的误解,父进程和子进程拥有各自独立的变量副本,id只是变量名相同,内存空间和值完全不同
进程调用fork,当控制转移内核中的fork代码后,内核做:
①:分配新的内存块和内核数据结构给子进程
②:将父进程部分数据结构内容拷贝至子进程
③:添加子进程到系统进程列表当中
④:fork返回,开始调度器调度

当一个进程调用fork之后,就有两个二进制代码相同的进程,而且它们都运行到相同的地方,但每个过程都将开始各自的旅程:
int main( void )
{
pid_t pid;
// 打印fork前的进程PID
printf("Before: pid is %d\n", getpid());
// 调用fork,失败则打印错误并退出
if ( (pid = fork()) == -1 ) {
perror("fork()");
exit(1);
}
// fork后,父子进程都会执行这行打印
printf("After: pid is %d, fork return %d\n", getpid(), pid);
// 休眠1秒,避免进程提前退出导致输出混乱
sleep(1);
return 0;
}
代码执行的结果:


所以fork之前父进程独立执行,fork后父子两个执行流分别执行,注意fork后谁先执行完全取决于调度器
1.2 写时拷贝
通常父子代码共享,父子在不写入时,数据也是共享的,当任意一方试图写入,便以写时拷贝的方式各自拷贝一份副本:

因为有写时拷贝技术的存在,所以父子进程得以彻底分离,完成了进程独立性的技术保证,写时拷贝是一种延时申请技术,可以提高整机内存的使用率
1.3 fork常规用法
①一个父进程希望复制自己,使父子进程同时执行不同的代码段
int main() {
pid_t pid = fork();
if (pid == -1) { // fork失败
perror("fork failed");
exit(1);
}
// 子进程分支:执行"数据计算"逻辑
else if (pid == 0) {
printf("【子进程】PID:%d,正在计算 1+2+...+100\n", getpid());
int sum = 0;
for (int i = 1; i <= 100; i++) {
sum += i;
}
printf("【子进程】计算完成:1+2+...+100 = %d\n", sum);
exit(0); // 子进程执行完退出
}
// 父进程分支:执行"等待+状态打印"逻辑
else {
printf("【父进程】PID:%d,子进程PID:%d\n", getpid(), pid);
printf("【父进程】等待子进程计算完成...\n");
wait(NULL); // 等待子进程结束
printf("【父进程】子进程已退出,父进程结束\n");
}
return 0;
}

②一个进程要执行一个不同的程序,例如子进程从fork返回后,调用exec函数
int main() {
pid_t pid = fork();
if (pid == -1) {
perror("fork failed");
exit(1);
}
// 子进程:调用exec替换为新程序
else if (pid == 0) {
printf("【子进程】PID:%d,准备执行新程序...\n", getpid());
// execl:执行当前目录下的child_prog程序,传入参数"10"
// 格式:execl(程序路径, 程序名, 参数1, 参数2, ..., NULL)
execl("./child_prog", "child_prog", "10", NULL);
// 注意:如果exec执行成功,下面的代码永远不会执行!
perror("exec failed"); // 只有exec失败时才会走到这里
exit(1);
}
// 父进程:等待子进程执行完新程序
else {
printf("【父进程】PID:%d,等待子进程执行新程序...\n", getpid());
int status;
wait(&status); // 等待子进程,获取退出状态
if (WIFEXITED(status)) {
printf("【父进程】子进程执行完毕,退出码:%d\n", WEXITSTATUS(status));
}
}
return 0;
}

1.4 fork调用失败的原因
系统中有太多进程
实际用户的进程数超过了限制
二、进程终止
进程终止的本质就是释放系统资源,就是释放进程申请的相关内核数据结构对应的数据和代码
2.1 进程退出场景
①代码运行完毕,结果正确
②代码运行完毕,结构不正确
③代码异常终止
2.2 进程常见退出方式
①从main返回
②调用exit
③_exit
异常退出:
ctrl + c,信号终止
2.2.1 退出码
退出码(退出状态)可以告诉我们最后一次执行的命令的状态,在命令结束以后,我们可以知道命令是成功完成的还是以错误结束的,其基本思想是,程序返回退出代码0时表示执行成功,没有问题,代码是1或0以外的任何代码都视为不成功
Linux Shell中的主要退出码:

退出码0表示命令执行无误,这是完成命令的理想状态
退出码1,我们也可以将其解释为"不被允许的操作",例如在没有sudo权限的情况下使用yum,
130(SIGINT 或 ^c)和143(SIGTREM)等终止信号时非常典型的,它们属于128+n信号,其中n表示终止码
可以使用strerror函数来获取退出码对应的描述
2.2.2 _exit函数

参数:status定义了进程的终止状态,父进程通过wait来获取该值、
说明:虽然status是int,但是仅有低八位可以被父进程所用,所以_exit(-1)时,在终端执行$?,发现返回值是255
2.2.3 exit函数

exit函数最后也会调用_exit,但在调用_exit之前,还做了其他工作:
①:执行用户通过atexit或on_exit定义的清理函数
②:关闭所有打开的流,所有的缓存数据均被写入
③:调用_exit

2.2.4 return 退出
return是一种更常见的退出进程方法,执行return n等同于执行exit(n),因为调用main的运用时函数会将main的返回值当做exit函数
三、进程等待
3.1 进程等待的重要性
①子进程退出,父进程如果不管不顾就可能造成'僵尸进程'的问题,进而造成内存泄漏,
②另外,进程一旦变成僵尸状态,那就会刀枪不入,即是是kill-9也杀不了,因为没有命令可以杀死一个已经死亡的进程,
③最后,父进程派给子进程的任务完成的如何我们需要知道,
④父进程通过进程等待的方式没回子进程资源并获取子进程退出信息
3.2 进程等待的方法
3.2.1 wait方法:

返回值:成功返回被等待进程pid,失败返回-1
参数:输出型参数,获取子进程退出状态,不关心则可以设置为NULL
3.2.2 waitpid 方法:

返回值:当正常返回的时候waitpid返回收集到的子进程的进程ID, 如果设置了选项WNOHANG,而调用中waitpid发现没有已退出的子进程可收集,则返回0,如果调用中出错,则返回-1,这时error会被设置为相应值以指示错误所在
参数:pid = -1,等待任意一个子进程,与wait等效
pid > 0,等待其进程ID与pid相等的子进程
status:输出型参数
WIFEXITED(status):若为正常终止进程返回的状态,则为真(查看进程是否正常退出)
WEXITSTATUS(status):若WIFEXITED非零,提取子进程退出码(查看进程的退出码)
options:默认为0,表示进程阻塞等待
WNOHANG:若pid指定的子进程没有结束,则waitpid()函数返回0,不予以等待,若正常结束,则返回该子进程的ID
①:如果子进程已经退出,调用wait和waitpid时会立即返回,并且释放资源,获得子进程退出信息
②:如果在任意时刻调用wait和waitpid,子进程存在且运行正常,则进程可能阻塞
③:如果不存在该子进程,则立即出错返回

父进程通过 fork 创建子进程后,在 parent_code 中调用 wait (&s) 阻塞等待,子进程执行 child_code 并 exit (n) 退出,其退出信息被打包存入 wait 的参数 s 中,父进程被唤醒后拿到 s(即 status)
3.2.3 获取子进程status
①:wait和waitpid,都有一个status参数,该参数是一个输出型参数,由操作系统填充
②:如果传递NULL,表示不关心子进程的退出状态信息
③:否则,操作系统会根据该参数,将子进程的退出信息反馈给父进程
④:status不能简单的当做整型来看,可以当做位图来看待:


3.2.4 阻塞等待与非阻塞等待
进程的阻塞等待方式:wait()
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/wait.h>
int main() {
pid_t pid = fork();
if (pid == 0) {
// 子进程:睡3秒再退出
sleep(3);
printf("子进程退出\n");
exit(0);
} else {
// 父进程:调用wait()阻塞等待
printf("父进程开始阻塞等待...\n");
wait(NULL); // 这里会卡住3秒,直到子进程退出
printf("父进程等待结束,继续执行\n");
}
return 0;
}

非阻塞等待:waitpid(pid,&status,WNOHANG)
父进程调用等待函数后,不会卡住,而是立即返回
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/wait.h>
int main() {
pid_t pid = fork();
if (pid == 0) {
// 子进程:睡3秒再退出
sleep(3);
printf("子进程退出\n");
exit(0);
} else {
// 父进程:非阻塞等待(循环检查子进程状态)
while (1) {
int ret = waitpid(pid, NULL, WNOHANG); // WNOHANG表示非阻塞
if (ret == 0) {
printf("子进程还在运行,父进程继续干别的事...\n");
sleep(1); // 父进程可以做其他操作
} else if (ret == pid) {
printf("父进程检测到子进程已退出,等待结束\n");
break;
}
}
}
return 0;
}

四、进程程序替换
fork()之后,父子各自执行代码的一部分,如果子进程想要执行一个全新的程序呢?我们使用进程的程序替换来完成这个功能
程序替换是通过特定的接口,加载磁盘上的哟个全新的程序(代码和数据),加载到调用进程的地址空间中!
4.1 替换原理
用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数以执行另一个程序,当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序调用,从新程序的启动例程开始执行,调用exec并不创建新进程,所以调用exec前后进程的id并未改变:

4.2 替换函数
有六种以exec开头的函数,统称exec函数:

4.2.1 函数解释
这些函数如果调用成功则加载新的程序从启动代码开始执行,不再返回
如果调用出错则返回-1
所以exec函数只有出错的返回值而没有成功的返回值
4.2.2 命名理解
这些函数原型看起来很容易混淆,我们需要掌握规律:


事实上,只有execve是真正的系统调用,其他的五个函数最终都会调用execve,所以execve在man手册第2节,其他函数在man手册第3节,这些函数之间的关系如下:

