Linux 进程控制

前言：本章重点

①：学习进程的创建，fork/vfork

②：学习进程终止，认识$

③：学习进程等待

④：写一个微型的shell（单独列一章），重新认识shell运行原理

一、进程创建

1.1 fork函数初识

在Linux中，fork函数是非常重要的函数，它从已创建的进程中创建一个新进程，新进程为子进程，而原进程为父进程

返回值：子进程返回0，父进程返回子进程的id，出错子进程不会被创建，父进程会得到返回值-1

现在产生了下面几个问题：

1.为什么要给子进程返回0，父进程返回子进程的pid？

这样的设计是为了父子进程能明确自己的身份，同时满足进程间管理的核心需求，具体原因有下面两点：

**①：给子进程返回0，**子进程不需要知道自己的pid，它可以通过getpid（）自己获取在需要的时候，但需要明确"我是子进程"，返回0是一个简单的身份标识，让子进程判断自己的身份，执行对应的逻辑

②：给父进程返回子进程的pid，父进程需要管理子进程（wait()/waitpid()等待子进程结束，回收资源），而PID是系统中进程的唯一标识，所以父进程必须要拿到子进程的PID，才能对特定子进程进行操作（多个子进程时，父进程需要知道具体等哪一个）

总结：子进程的需求：我是不是子进程，返回0表示是，父进程的需求：我的子进程是谁，返回子进程PID表示这是你要管理的子进程

2.为什么一个函数fork会有俩个返回值？

这是因为fork()执行后会"复制进程"，导致同一个函数调用在两个独立的进程中分别返回，本质是"进程分裂"带来的结果：

①：先尝试创建一个与当前进程（父进程）完全相同的副本（子进程，包含代码、数据、堆栈等）

②：若成功，父进程和子进程会同时从fork（）的下一行代码继续执行

所以fork()的两个返回值其实是：父进程的fork()调用返回子进程的PID，子进程的fork()调用返回0，相当于一个函数调用被两个进程各自执行了返回操作，所以看起来有两个返回值

3.为什么一个id既等于0，又大于0？

这是对进程空间独立性的误解，父进程和子进程拥有各自独立的变量副本，id只是变量名相同，内存空间和值完全不同

进程调用fork,当控制转移内核中的fork代码后，内核做：

①：分配新的内存块和内核数据结构给子进程

②：将父进程部分数据结构内容拷贝至子进程

③：添加子进程到系统进程列表当中

④：fork返回，开始调度器调度

当一个进程调用fork之后，就有两个二进制代码相同的进程，而且它们都运行到相同的地方，但每个过程都将开始各自的旅程：

复制代码

int main( void )
{
    pid_t pid;
    // 打印fork前的进程PID
    printf("Before: pid is %d\n", getpid());
    
    // 调用fork，失败则打印错误并退出
    if ( (pid = fork()) == -1 ) {
        perror("fork()");
        exit(1);
    }
    
    // fork后，父子进程都会执行这行打印
    printf("After: pid is %d, fork return %d\n", getpid(), pid);
    // 休眠1秒，避免进程提前退出导致输出混乱
    sleep(1);
    
    return 0;
}

代码执行的结果：

所以fork之前父进程独立执行，fork后父子两个执行流分别执行，注意fork后谁先执行完全取决于调度器

1.2 写时拷贝

通常父子代码共享，父子在不写入时，数据也是共享的，当任意一方试图写入，便以写时拷贝的方式各自拷贝一份副本：

因为有写时拷贝技术的存在，所以父子进程得以彻底分离，完成了进程独立性的技术保证，写时拷贝是一种延时申请技术，可以提高整机内存的使用率

1.3 fork常规用法

①一个父进程希望复制自己，使父子进程同时执行不同的代码段

复制代码

int main() {
    pid_t pid = fork();

    if (pid == -1) { // fork失败
        perror("fork failed");
        exit(1);
    }

    // 子进程分支：执行"数据计算"逻辑
    else if (pid == 0) {
        printf("【子进程】PID：%d，正在计算 1+2+...+100\n", getpid());
        int sum = 0;
        for (int i = 1; i <= 100; i++) {
            sum += i;
        }
        printf("【子进程】计算完成：1+2+...+100 = %d\n", sum);
        exit(0); // 子进程执行完退出
    }

    // 父进程分支：执行"等待+状态打印"逻辑
    else {
        printf("【父进程】PID：%d，子进程PID：%d\n", getpid(), pid);
        printf("【父进程】等待子进程计算完成...\n");
        wait(NULL); // 等待子进程结束
        printf("【父进程】子进程已退出，父进程结束\n");
    }

    return 0;
}

②一个进程要执行一个不同的程序，例如子进程从fork返回后，调用exec函数

复制代码

int main() {
    pid_t pid = fork();

    if (pid == -1) {
        perror("fork failed");
        exit(1);
    }

    // 子进程：调用exec替换为新程序
    else if (pid == 0) {
        printf("【子进程】PID：%d，准备执行新程序...\n", getpid());
        // execl：执行当前目录下的child_prog程序，传入参数"10"
        // 格式：execl(程序路径, 程序名, 参数1, 参数2, ..., NULL)
        execl("./child_prog", "child_prog", "10", NULL);
        
        // 注意：如果exec执行成功，下面的代码永远不会执行！
        perror("exec failed"); // 只有exec失败时才会走到这里
        exit(1);
    }

    // 父进程：等待子进程执行完新程序
    else {
        printf("【父进程】PID：%d，等待子进程执行新程序...\n", getpid());
        int status;
        wait(&status); // 等待子进程，获取退出状态
        if (WIFEXITED(status)) {
            printf("【父进程】子进程执行完毕，退出码：%d\n", WEXITSTATUS(status));
        }
    }

    return 0;
}

1.4 fork调用失败的原因

系统中有太多进程

实际用户的进程数超过了限制

二、进程终止

进程终止的本质就是释放系统资源，就是释放进程申请的相关内核数据结构对应的数据和代码

2.1 进程退出场景

①代码运行完毕，结果正确

②代码运行完毕，结构不正确

③代码异常终止

2.2 进程常见退出方式

①从main返回

②调用exit

③_exit

异常退出：

ctrl + c，信号终止

2.2.1 退出码

退出码（退出状态）可以告诉我们最后一次执行的命令的状态，在命令结束以后，我们可以知道命令是成功完成的还是以错误结束的，其基本思想是，程序返回退出代码0时表示执行成功，没有问题，代码是1或0以外的任何代码都视为不成功

Linux Shell中的主要退出码：

退出码0表示命令执行无误，这是完成命令的理想状态

退出码1,我们也可以将其解释为"不被允许的操作"，例如在没有sudo权限的情况下使用yum，

130（SIGINT 或 ^c）和143（SIGTREM）等终止信号时非常典型的，它们属于128+n信号，其中n表示终止码

可以使用strerror函数来获取退出码对应的描述

2.2.2 _exit函数

参数：status定义了进程的终止状态，父进程通过wait来获取该值、

说明：虽然status是int，但是仅有低八位可以被父进程所用，所以_exit(-1)时，在终端执行$?,发现返回值是255

2.2.3 exit函数

exit函数最后也会调用_exit，但在调用_exit之前，还做了其他工作：

①：执行用户通过atexit或on_exit定义的清理函数

②：关闭所有打开的流，所有的缓存数据均被写入

③：调用_exit

2.2.4 return 退出

return是一种更常见的退出进程方法，执行return n等同于执行exit(n),因为调用main的运用时函数会将main的返回值当做exit函数

三、进程等待

3.1 进程等待的重要性

①子进程退出，父进程如果不管不顾就可能造成'僵尸进程'的问题，进而造成内存泄漏，

②另外，进程一旦变成僵尸状态，那就会刀枪不入，即是是kill-9也杀不了，因为没有命令可以杀死一个已经死亡的进程，

③最后，父进程派给子进程的任务完成的如何我们需要知道，

④父进程通过进程等待的方式没回子进程资源并获取子进程退出信息

3.2 进程等待的方法

3.2.1 wait方法：

返回值：成功返回被等待进程pid，失败返回-1

参数：输出型参数，获取子进程退出状态，不关心则可以设置为NULL

3.2.2 waitpid 方法：

返回值：当正常返回的时候waitpid返回收集到的子进程的进程ID，如果设置了选项WNOHANG，而调用中waitpid发现没有已退出的子进程可收集，则返回0，如果调用中出错，则返回-1，这时error会被设置为相应值以指示错误所在

参数：pid = -1,等待任意一个子进程，与wait等效

pid > 0,等待其进程ID与pid相等的子进程

status：输出型参数

WIFEXITED(status):若为正常终止进程返回的状态，则为真（查看进程是否正常退出）

WEXITSTATUS(status):若WIFEXITED非零，提取子进程退出码（查看进程的退出码）

options：默认为0，表示进程阻塞等待

WNOHANG：若pid指定的子进程没有结束，则waitpid（）函数返回0，不予以等待，若正常结束，则返回该子进程的ID

①：如果子进程已经退出，调用wait和waitpid时会立即返回，并且释放资源，获得子进程退出信息

②：如果在任意时刻调用wait和waitpid，子进程存在且运行正常，则进程可能阻塞

③：如果不存在该子进程，则立即出错返回

父进程通过 fork 创建子进程后，在 parent_code 中调用 wait (&s) 阻塞等待，子进程执行 child_code 并 exit (n) 退出，其退出信息被打包存入 wait 的参数 s 中，父进程被唤醒后拿到 s（即 status）

3.2.3 获取子进程status

①：wait和waitpid，都有一个status参数，该参数是一个输出型参数，由操作系统填充

②：如果传递NULL，表示不关心子进程的退出状态信息

③：否则，操作系统会根据该参数，将子进程的退出信息反馈给父进程

④：status不能简单的当做整型来看，可以当做位图来看待：

3.2.4 阻塞等待与非阻塞等待

进程的阻塞等待方式：wait()

复制代码

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/wait.h>

int main() {
    pid_t pid = fork();
    if (pid == 0) {
        // 子进程：睡3秒再退出
        sleep(3);
        printf("子进程退出\n");
        exit(0);
    } else {
        // 父进程：调用wait()阻塞等待
        printf("父进程开始阻塞等待...\n");
        wait(NULL); // 这里会卡住3秒，直到子进程退出
        printf("父进程等待结束，继续执行\n");
    }
    return 0;
}

非阻塞等待：waitpid（pid，&status，WNOHANG）

父进程调用等待函数后，不会卡住，而是立即返回

复制代码

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/wait.h>

int main() {
    pid_t pid = fork();
    if (pid == 0) {
        // 子进程：睡3秒再退出
        sleep(3);
        printf("子进程退出\n");
        exit(0);
    } else {
        // 父进程：非阻塞等待（循环检查子进程状态）
        while (1) {
            int ret = waitpid(pid, NULL, WNOHANG); // WNOHANG表示非阻塞
            if (ret == 0) {
                printf("子进程还在运行，父进程继续干别的事...\n");
                sleep(1); // 父进程可以做其他操作
            } else if (ret == pid) {
                printf("父进程检测到子进程已退出，等待结束\n");
                break;
            }
        }
    }
    return 0;
}

四、进程程序替换

fork（）之后，父子各自执行代码的一部分，如果子进程想要执行一个全新的程序呢？我们使用进程的程序替换来完成这个功能

程序替换是通过特定的接口，加载磁盘上的哟个全新的程序（代码和数据），加载到调用进程的地址空间中！

4.1 替换原理

用fork创建子进程后执行的是和父进程相同的程序（但有可能执行不同的代码分支），子进程往往要调用一种exec函数以执行另一个程序，当进程调用一种exec函数时，该进程的用户空间代码和数据完全被新程序调用，从新程序的启动例程开始执行，调用exec并不创建新进程，所以调用exec前后进程的id并未改变：

4.2 替换函数

有六种以exec开头的函数，统称exec函数：

4.2.1 函数解释

这些函数如果调用成功则加载新的程序从启动代码开始执行，不再返回

如果调用出错则返回-1

所以exec函数只有出错的返回值而没有成功的返回值

4.2.2 命名理解

这些函数原型看起来很容易混淆，我们需要掌握规律：

事实上，只有execve是真正的系统调用，其他的五个函数最终都会调用execve，所以execve在man手册第2节，其他函数在man手册第3节，这些函数之间的关系如下：