Linux 进程控制

前言:本章重点

①:学习进程的创建,fork/vfork

②:学习进程终止,认识$

③:学习进程等待

④:写一个微型的shell(单独列一章),重新认识shell运行原理

一、进程创建

1.1 fork函数初识

在Linux中,fork函数是非常重要的函数,它从已创建的进程中创建一个新进程,新进程为子进程,而原进程为父进程

返回值:子进程返回0,父进程返回子进程的id,出错子进程不会被创建,父进程会得到返回值-1

现在产生了下面几个问题:

1.为什么要给子进程返回0,父进程返回子进程的pid?

这样的设计是为了父子进程能明确自己的身份,同时满足进程间管理的核心需求,具体原因有下面两点:

**①:给子进程返回0,**子进程不需要知道自己的pid,它可以通过getpid()自己获取在需要的时候,但需要明确"我是子进程",返回0是一个简单的身份标识,让子进程判断自己的身份,执行对应的逻辑

②:给父进程返回子进程的pid,父进程需要管理子进程(wait()/waitpid()等待子进程结束,回收资源),而PID是系统中进程的唯一标识,所以父进程必须要拿到子进程的PID,才能对特定子进程进行操作(多个子进程时,父进程需要知道具体等哪一个)

总结:子进程的需求:我是不是子进程,返回0表示是,父进程的需求:我的子进程是谁,返回子进程PID表示这是你要管理的子进程

2.为什么一个函数fork会有俩个返回值?

这是因为fork()执行后会"复制进程",导致同一个函数调用在两个独立的进程中分别返回,本质是"进程分裂"带来的结果:

①:先尝试创建一个与当前进程(父进程)完全相同的副本(子进程,包含代码、数据、堆栈等)

②:若成功,父进程和子进程会同时从fork()的下一行代码继续执行

所以fork()的两个返回值其实是:父进程的fork()调用返回子进程的PID,子进程的fork()调用返回0,相当于一个函数调用被两个进程各自执行了返回操作,所以看起来有两个返回值

3.为什么一个id既等于0,又大于0?

这是对进程空间独立性的误解,父进程和子进程拥有各自独立的变量副本,id只是变量名相同,内存空间和值完全不同

进程调用fork,当控制转移内核中的fork代码后,内核做:

①:分配新的内存块和内核数据结构给子进程

②:将父进程部分数据结构内容拷贝至子进程

③:添加子进程到系统进程列表当中

④:fork返回,开始调度器调度

当一个进程调用fork之后,就有两个二进制代码相同的进程,而且它们都运行到相同的地方,但每个过程都将开始各自的旅程:

复制代码
int main( void )
{
    pid_t pid;
    // 打印fork前的进程PID
    printf("Before: pid is %d\n", getpid());
    
    // 调用fork,失败则打印错误并退出
    if ( (pid = fork()) == -1 ) {
        perror("fork()");
        exit(1);
    }
    
    // fork后,父子进程都会执行这行打印
    printf("After: pid is %d, fork return %d\n", getpid(), pid);
    // 休眠1秒,避免进程提前退出导致输出混乱
    sleep(1);
    
    return 0;
}

代码执行的结果:

所以fork之前父进程独立执行,fork后父子两个执行流分别执行,注意fork后谁先执行完全取决于调度器

1.2 写时拷贝

通常父子代码共享,父子在不写入时,数据也是共享的,当任意一方试图写入,便以写时拷贝的方式各自拷贝一份副本:

因为有写时拷贝技术的存在,所以父子进程得以彻底分离,完成了进程独立性的技术保证,写时拷贝是一种延时申请技术,可以提高整机内存的使用率

1.3 fork常规用法

①一个父进程希望复制自己,使父子进程同时执行不同的代码段

复制代码
int main() {
    pid_t pid = fork();

    if (pid == -1) { // fork失败
        perror("fork failed");
        exit(1);
    }

    // 子进程分支:执行"数据计算"逻辑
    else if (pid == 0) {
        printf("【子进程】PID:%d,正在计算 1+2+...+100\n", getpid());
        int sum = 0;
        for (int i = 1; i <= 100; i++) {
            sum += i;
        }
        printf("【子进程】计算完成:1+2+...+100 = %d\n", sum);
        exit(0); // 子进程执行完退出
    }

    // 父进程分支:执行"等待+状态打印"逻辑
    else {
        printf("【父进程】PID:%d,子进程PID:%d\n", getpid(), pid);
        printf("【父进程】等待子进程计算完成...\n");
        wait(NULL); // 等待子进程结束
        printf("【父进程】子进程已退出,父进程结束\n");
    }

    return 0;
}

②一个进程要执行一个不同的程序,例如子进程从fork返回后,调用exec函数

复制代码
int main() {
    pid_t pid = fork();

    if (pid == -1) {
        perror("fork failed");
        exit(1);
    }

    // 子进程:调用exec替换为新程序
    else if (pid == 0) {
        printf("【子进程】PID:%d,准备执行新程序...\n", getpid());
        // execl:执行当前目录下的child_prog程序,传入参数"10"
        // 格式:execl(程序路径, 程序名, 参数1, 参数2, ..., NULL)
        execl("./child_prog", "child_prog", "10", NULL);
        
        // 注意:如果exec执行成功,下面的代码永远不会执行!
        perror("exec failed"); // 只有exec失败时才会走到这里
        exit(1);
    }

    // 父进程:等待子进程执行完新程序
    else {
        printf("【父进程】PID:%d,等待子进程执行新程序...\n", getpid());
        int status;
        wait(&status); // 等待子进程,获取退出状态
        if (WIFEXITED(status)) {
            printf("【父进程】子进程执行完毕,退出码:%d\n", WEXITSTATUS(status));
        }
    }

    return 0;
}

1.4 fork调用失败的原因

系统中有太多进程

实际用户的进程数超过了限制

二、进程终止

进程终止的本质就是释放系统资源,就是释放进程申请的相关内核数据结构对应的数据和代码

2.1 进程退出场景

①代码运行完毕,结果正确

②代码运行完毕,结构不正确

③代码异常终止

2.2 进程常见退出方式

①从main返回

②调用exit

③_exit

异常退出:

ctrl + c,信号终止

2.2.1 退出码

退出码(退出状态)可以告诉我们最后一次执行的命令的状态,在命令结束以后,我们可以知道命令是成功完成的还是以错误结束的,其基本思想是,程序返回退出代码0时表示执行成功,没有问题,代码是1或0以外的任何代码都视为不成功

Linux Shell中的主要退出码:

退出码0表示命令执行无误,这是完成命令的理想状态

退出码1,我们也可以将其解释为"不被允许的操作",例如在没有sudo权限的情况下使用yum,

130(SIGINT 或 ^c)和143(SIGTREM)等终止信号时非常典型的,它们属于128+n信号,其中n表示终止码

可以使用strerror函数来获取退出码对应的描述

2.2.2 _exit函数

参数:status定义了进程的终止状态,父进程通过wait来获取该值

说明:虽然status是int,但是仅有低八位可以被父进程所用,所以_exit(-1)时,在终端执行$?,发现返回值是255

2.2.3 exit函数

exit函数最后也会调用_exit,但在调用_exit之前,还做了其他工作:

①:执行用户通过atexit或on_exit定义的清理函数

②:关闭所有打开的流,所有的缓存数据均被写入

③:调用_exit

2.2.4 return 退出

return是一种更常见的退出进程方法,执行return n等同于执行exit(n),因为调用main的运用时函数会将main的返回值当做exit函数

三、进程等待

3.1 进程等待的重要性

①子进程退出,父进程如果不管不顾就可能造成'僵尸进程'的问题,进而造成内存泄漏,

②另外,进程一旦变成僵尸状态,那就会刀枪不入,即是是kill-9也杀不了,因为没有命令可以杀死一个已经死亡的进程,

③最后,父进程派给子进程的任务完成的如何我们需要知道,

④父进程通过进程等待的方式没回子进程资源并获取子进程退出信息

3.2 进程等待的方法

3.2.1 wait方法:

返回值:成功返回被等待进程pid,失败返回-1

参数:输出型参数,获取子进程退出状态,不关心则可以设置为NULL

3.2.2 waitpid 方法:

返回值:当正常返回的时候waitpid返回收集到的子进程的进程ID, 如果设置了选项WNOHANG,而调用中waitpid发现没有已退出的子进程可收集,则返回0,如果调用中出错,则返回-1,这时error会被设置为相应值以指示错误所在

参数:pid = -1,等待任意一个子进程,与wait等效

pid > 0,等待其进程ID与pid相等的子进程

status:输出型参数

WIFEXITED(status):若为正常终止进程返回的状态,则为真(查看进程是否正常退出

WEXITSTATUS(status):若WIFEXITED非零,提取子进程退出码(查看进程的退出码

options:默认为0,表示进程阻塞等待

WNOHANG:若pid指定的子进程没有结束,则waitpid()函数返回0,不予以等待,若正常结束,则返回该子进程的ID

①:如果子进程已经退出,调用wait和waitpid时会立即返回,并且释放资源,获得子进程退出信息

②:如果在任意时刻调用wait和waitpid,子进程存在且运行正常,则进程可能阻塞

③:如果不存在该子进程,则立即出错返回

父进程通过 fork 创建子进程后,在 parent_code 中调用 wait (&s) 阻塞等待,子进程执行 child_code 并 exit (n) 退出,其退出信息被打包存入 wait 的参数 s 中,父进程被唤醒后拿到 s(即 status)

3.2.3 获取子进程status

①:wait和waitpid,都有一个status参数,该参数是一个输出型参数,由操作系统填充

②:如果传递NULL,表示不关心子进程的退出状态信息

③:否则,操作系统会根据该参数,将子进程的退出信息反馈给父进程

④:status不能简单的当做整型来看,可以当做位图来看待:

3.2.4 阻塞等待与非阻塞等待

进程的阻塞等待方式:wait()

复制代码
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/wait.h>

int main() {
    pid_t pid = fork();
    if (pid == 0) {
        // 子进程:睡3秒再退出
        sleep(3);
        printf("子进程退出\n");
        exit(0);
    } else {
        // 父进程:调用wait()阻塞等待
        printf("父进程开始阻塞等待...\n");
        wait(NULL); // 这里会卡住3秒,直到子进程退出
        printf("父进程等待结束,继续执行\n");
    }
    return 0;
}

非阻塞等待:waitpid(pid,&status,WNOHANG)

父进程调用等待函数后,不会卡住,而是立即返回

复制代码
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/wait.h>

int main() {
    pid_t pid = fork();
    if (pid == 0) {
        // 子进程:睡3秒再退出
        sleep(3);
        printf("子进程退出\n");
        exit(0);
    } else {
        // 父进程:非阻塞等待(循环检查子进程状态)
        while (1) {
            int ret = waitpid(pid, NULL, WNOHANG); // WNOHANG表示非阻塞
            if (ret == 0) {
                printf("子进程还在运行,父进程继续干别的事...\n");
                sleep(1); // 父进程可以做其他操作
            } else if (ret == pid) {
                printf("父进程检测到子进程已退出,等待结束\n");
                break;
            }
        }
    }
    return 0;
}

四、进程程序替换

fork()之后,父子各自执行代码的一部分,如果子进程想要执行一个全新的程序呢?我们使用进程的程序替换来完成这个功能

程序替换是通过特定的接口,加载磁盘上的哟个全新的程序(代码和数据),加载到调用进程的地址空间中

4.1 替换原理

用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数以执行另一个程序,当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序调用,从新程序的启动例程开始执行,调用exec并不创建新进程,所以调用exec前后进程的id并未改变:

4.2 替换函数

有六种以exec开头的函数,统称exec函数:

4.2.1 函数解释

这些函数如果调用成功则加载新的程序从启动代码开始执行,不再返回

如果调用出错则返回-1

所以exec函数只有出错的返回值而没有成功的返回值

4.2.2 命名理解

这些函数原型看起来很容易混淆,我们需要掌握规律:

事实上,只有execve是真正的系统调用,其他的五个函数最终都会调用execve,所以execve在man手册第2节,其他函数在man手册第3节,这些函数之间的关系如下:

相关推荐
暖阳之下2 小时前
学习周报二十七
学习
罗湖老棍子2 小时前
最小函数值(minval)(信息学奥赛一本通- P1370)
数据结构·c++·算法··优先队列·
一念一花一世界2 小时前
sourcefare零基础学习 - 使用自定义权限优化项目管理
学习·sonarqube·sourcefare·代码扫描工具
肆悟先生2 小时前
3.17 内联函数
c++
阿恩.7702 小时前
前沿科技计算机国际期刊征稿:电子、AI与网络计算
人工智能·经验分享·笔记·计算机网络·考研·云计算
代码游侠2 小时前
应用——MPlayer 媒体播放器系统代码详解
linux·运维·笔记·学习·算法
龘龍龙2 小时前
Python基础学习(六)
开发语言·python·学习
仰泳的熊猫2 小时前
1109 Group Photo
数据结构·c++·算法·pat考试
SunkingYang2 小时前
MFC中事件与消息有什么关联,区别与联系
c++·mfc·消息·事件·区别·联系·关联