文章目录

[五、fork 函数，创建进程](#五、fork 函数，创建进程)
- - 写时拷贝
六、进程终止
- - [1. 退出码](#1. 退出码)
  - [2. 如何终止程序](#2. 如何终止程序)
七、进程等待
- - [1. 概念](#1. 概念)
  - [2. wait 函数](#2. wait 函数)
  - - [waitpid 函数 🔺](#waitpid 函数 🔺)
  - [3. 阻塞等待](#3. 阻塞等待)
八、程序替换
- - [1. execl](#1. execl)
  - [2. execv](#2. execv)
  - [3. execlp](#3. execlp)
  - [4. execvp](#4. execvp)
  - [5. execle 🔺](#5. execle 🔺)
  - [6. execvpe 、execve](#6. execvpe 、execve)
[一个简易的 shell](#一个简易的 shell)

五、fork 函数，创建进程

#include <unistd.h>

pid_t fork(void);

返回值：

子进程 返回 0

父进程 返回 子进程 id

出错返回 -1

进程调用 fork，当控制转移到内核中的 fork 代码后，内核做：

分配新的内存块和内核数据结构给子进程
将父进程部分数据结构内容拷贝至子进程
添加子进程到系统进程列表当中
fork返回，开始调度器调度

fork 之前，父进程独立执行，
fork 之后，父子两个执行流分别执行 fork 后面的代码。

注意，fork之后，谁先执行完全由调度器决定。

写时拷贝

通常，父子代码共享，父子再不写入时，数据也是共享的，当任意一方试图写入，便以写时拷贝的方式各自一份副

本。具体见下图：

fork常规用法

一个父进程希望复制自己，使父子进程同时执行不同的代码段。例如，父进程等待客户端请求，生成子进程来处理请求。
一个进程要执行一个不同的程序。例如子进程从fork返回后，调用exec函数。

fork调用失败的原因

系统中有太多的进程
实际用户的进程数超过了限制

六、进程终止

如何理解进程退出?

OS内少了一个进程，OS就要释放进程对应的内核数据结构 + 代码和数据（如果有独立的）

进程结束情况分类：

a. 执行完了，正常退出

结果正确
结果不正确

b. 崩溃了，进程异常（通过信号的方式，后面更新）

崩溃的本质: 进程因为某些原因，导致进程收到了来自操作系统的信号 kill -9

1. 退出码

我们说，进程是有退出码的。

比如 main 函数中的 return x; 正常执行完了

结果正确，退出码为 0，
结果不正确， 1、2、3、4 则表示不同的原因（供用户进行进程退出健康状态的判定）

echo $? 可以 查看最近执行的进程的退出码

bash 复制代码

echo $?

2. 如何终止程序

正常终止有三种方式：

① main 函数 return。

其他函数return，仅仅代表该函数返回
进程执行，本质是main执行流执行!

② void exit(int status) 函数退出

头文件 #include <stdlib.h>

status 代表就是进程的退出码
等价于 main return XXX
会刷新缓冲区、关闭流等
其实 exit 函数也是封装调用的 _exit 函数

③ void _exit(int status) 函数退出

头文件 #include <stdlib.h>

status 代表就是进程的退出码
直接退出程序，不处理缓冲区等

复制代码

由此我们可以推测出的就是：
	缓冲区，一定不在 OS 内，不然肯定都能刷新了，事实上并没有
这是因为用户层和 OS 之间，还有一个 C库。（后面更新）

异常退出

ctrl + C 信号终止（信号！！后面更新）

七、进程等待

1. 概念

进程等待就是通过系统调用，获取子进程退出码或者退出信号的方式，顺便释放内存问题。

进程等待的作用：

避免内存泄漏
获取子进程执行的结果（如果必要）
- 对于进程退出的结果查验，我们通过的还是上述提过的信号 + 退出码的方案。

等待，实际上就是 父进程对子进程的等待

2. wait 函数

pid_t wait(int *status)

头文件： #include <sys/wait.h>

返回值：等待成功则返回子进程的 PID

waitpid 函数 🔺

pid_t waitpid(pid_t pid, int *status, int options);

头文件 #include <sys/wait.h>

返回值：

> 0，success（返回的是对应子进程的 pid）

==-1，failed（一般不会失败，pid 传错了会导致失败）
== 0，在选项设置了 WNOHANG 的情况下，发现没有已退出的子进程可收集

参数 pid：

>0，表示等待指定的子进程

==-1，表示等待任一个子进程，与 wait 等效

参数 status：是一个输出型参数

我们会想得到，子进程的退出状态，即信号 + 返回码

如何用一个整数返回两个整数...？实际上这里的 status 是类似位图作用的。信号和返回码都不超过一定值，用一个整数位存储足够啦！（见下文）

WIFEXITED(status)：若为正常终止子进程返回的状态，则为真。（查看进程是否是正常退出）

WEXITSTATUS(status)：若 WIFEXITED 非零，提取子进程退出码。（查看进程的退出码）

参数 options：

0，默认父进程进行阻塞等待

WNOHANG，父进程进行非阻塞轮询

🌰使用举例：

cpp 复制代码

int status = 0;
pid_t ret_id = waitpid(id, &status, WNOHANG);
if(ret_id < 0)
{
    printf("waitpid error!\n");
    exit(1);
}
else if(ret_id == 0)	// 子进程还没结束
{
    RunTask();
    sleep(1);
    continue;
}
else					// 子进程结束了
{
    if(WIFEXITED(status))	// 正常退出
    {
        printf("wait success, child exit code: %d\n", WEXITSTATUS(status));
    }
    else					// 异常退出
    {
        printf("wait success, child exit signal: %d\n", status & 0x7F);
    }
    break;
}

status 记录信号和退出码的方式：
00000000 00000000 00000000 00000000

高 16 位不需要
低 16 位中，次低的 8 位（黑体比特位），储存退出状态
最低 7 位（斜体比特位），储存终止信号
第8位，是 core dump 标志（后面更新，信号篇）

想要自己访问信号和退出码，我们用如下方式：

cpp 复制代码

// 退出码
(status>>8) & 0xFF;
// 终止信号
 status & 0x7F;

所以，

父进程如何拿到子进程的退出码和终止信号的呢？

实际上，进程的 PCB 中，就有这两个成员值。

cpp 复制代码

struct task_struct
{
	// ...
	int exit_code;
	int exit_signal;
	
	task_struct* parent;
};

当子进程执行完毕时 main 函数的退出码，写入 PCB 的 exit_code 里
如果出异常，OS 会把遇到异常时的信号编号写到 PCB 的 exit_signal 里
进程退出之后，OS 会将进程 PCB 维护起来，通过系统调用接口 waitpid / wait，就可以让用户拿到这些数据。

3. 阻塞等待

父进程在 wait 的时候，如果子进程没有退出，父进程只能一直调用 waitpid 进行等待，这就叫 阻塞等待。

可以理解为父进程从 R 状态，开始等待，进入 S 状态。
这个等待不在运行队列，可以理解为在一个只有它一个节点的等待队列里等待。
等待的同时，子进程的 CPB 中找到并挂接到父进程，直到子进程结束，父进程再回到运行队列（R 状态）

如果我们不想阻塞等待，即不想在 waitpid 处卡住呢？

非阻塞轮询（WNOHANG，waitpid 的最后一个参数）
故，我们在日常这样情况的时候，说这个程序 夯住了。

八、程序替换

用 fork 创建子进程后执行的是和父进程相同的程序（但有可能执行不同的代码分支），子进程往往要调用一种 exec 函数执行另一个程序。当进程调用一种 exec 函数时，该进程的用户空间代码和数据完全被新程序替换，从新程序的启动例程开始执行。调用 exec 并不创建新进程，所以调用 exec 前后该进程的 pid 并未改变。

exec 这一系统接口，也被叫做 加载器。

简单来说：

程序替换 不产生新的进程
程序替换是 整体替换，不能局部替换
程序替换 只会影响调用进程，因为进程具有独立性（写时拷贝）
- 加载拥有新代码的新进程哦！这说明了，在代码区，也可以发生写时拷贝！！！

接下来是 exec 系列函数，

头文件是#include <unistd.h>

1. execl

记忆：l 代表 list，把参数一个一个列表一样的传给函数。

int execl(const char *path, const char *arg, ...)

返回值：

成功时，发生整体替换，也不会有返回值

失败时，会继续调用后面的代码，此时才有返回值，返回也有意义

参数 path：

带路径的可执行程序

参数包：

在命令行怎么执行这个命令，就以空格为分割，一个一个的传给 execl 就可以了。最后以 NULL 结尾。

ps：对于该函数不用进行返回值判断，只要继续向后运行了，就一定是失败的

🌰使用举例

cpp 复制代码

execl("/bin/ls", "ls", "-a", "-l", NULL);

2. execv

记忆：v 代表 vector，数组作为参数。

int execv(const char *path, char *const argv[])

返回值：

成功时，发生整体替换，也不会有返回值

失败时，会继续调用后面的代码，此时才有返回值，返回也有意义

参数 path：

带路径的可执行程序

参数 argv：

设置一个 char* const argv\[\] 的指针数组，在命令行怎么执行这个命令，就以空格为分割，放入数组。最后以 NULL 结尾。

🌰使用举例

cpp 复制代码

char *const myargv[] = { "ls", "-a", "-l", NULL };

execv("/bin/ls", myargv);

3. execlp

记忆：不带 p 的需要指定程序路径，而带 p 的只需要指定程序名即可，系统会自动在环境变量 PATH 中查找。

int execlp(const char *file, const char *arg, ...)

返回值：

成功时，发生整体替换，也不会有返回值

失败时，会继续调用后面的代码，此时才有返回值，返回也有意义

参数 file：

可执行程序名，该程序必须要在环境变量 PATH 中可以被调用

参数包：

在命令行怎么执行这个命令，就以空格为分割，一个一个的传给 execl 就可以了。最后以 NULL 结尾。

🌰使用举例

cpp 复制代码

execlp("ls", "ls", "-a", "-l", NULL);

这里两个一样的参数，不要省略！！！即使有时候省略了也能跑，不要这样写！！

4. execvp

记忆： p，直接给数组名； v，以数组方式传参。

int execvp(const char *file, char *const argv[])

返回值：

成功时，发生整体替换，也不会有返回值

失败时，会继续调用后面的代码，此时才有返回值，返回也有意义

参数 file：

可执行程序名，该程序必须要在环境变量 PATH 中可以被调用

参数 argv：

设置一个 char* const argv\[\] 的指针数组，在命令行怎么执行这个命令，就以空格为分割，放入数组。最后以 NULL 结尾。

🌰使用举例

cpp 复制代码

char *const myargv[] = { "ls", "-a", "-l", NULL };

execvp("ls", myargv);

5. execle 🔺

记忆： p，直接给数组名； v，以数组方式传参。

int execvp(const char *path, const char *arg, ..., char *const envp[])

返回值：

成功时，发生整体替换，也不会有返回值

失败时，会继续调用后面的代码，此时才有返回值，返回也有意义

参数 path：

带路径的可执行程序

参数包：

在命令行怎么执行这个命令，就以空格为分割，一个一个的传给 execl 就可以了。最后以 NULL 结尾。

参数 envp：

自定义环境变量，并且是 覆盖式传入

引申另一个函数

int putenv(char *string)

头文件：#include <stdlib.h>

作用：把参数位置的字符串作为环境变量，加入 PATH

🌰使用举例

cpp 复制代码

// 【系统环境变量】
extern char** environ;
/* 自定义环境变量
char *cosnt myenv[] = {
	"MYENV=ThisIsValue",
	NULL
};*/
// 【把自定义变量加入系统环境变量】
putenv("MYENV=ThisIsValue");	// 此时就被添加进 environ 里了

// 要求既传 系统的 又传 自定义的
execle("./otherproc", "otherproc", NULL, environ);

🎯环境变量具有全局性，可以被子进程继承下去。 这句话如何深刻理解？

bash 是最父的父进程！
他调用子进程的时候，只需要通过 exec 函数，
传入相应的环境列表，子进程就共享了 bash 的环境变量！！！

实际上，也正是 OS 调用 exec，调用的我们写的 main 函数，main 函数的参数 envp 也就是 OS 传给我们的。

6. execvpe 、execve

不多说喽

int execvpe (const char* file, char *const argv[], char *const envp[])
int execve (const char* path, char *const argv[], char *const envp[])

这些 exec 函数，实际上，只有 execve 是系统调用，其余的 6 个都是这个调用的封装

一个简易的 shell

👉🔗链接在此

【Linux】进程篇Ⅱ：进程开始、进程终止、进程等待、程序替换

文章目录

五、fork 函数，创建进程

写时拷贝

六、进程终止

1. 退出码

2. 如何终止程序

七、进程等待

1. 概念

2. wait 函数

waitpid 函数 🔺

3. 阻塞等待

八、程序替换

1. execl

2. execv

3. execlp

4. execvp

5. execle 🔺

6. execvpe 、execve

一个简易的 shell