Linux--进程控制

ok，我们今天学习Linux中的进程控制（进程创建、终止、等待、替换）

进程创建

fork函数

在linux中fork函数是⾮常重要的函数，它从已存在进程中创建⼀个新进程。新进程为子进程，⽽原进程为父进程。

cpp 复制代码

#include <unistd.h>
pid_t fork(void);
返回值：⾃进程中返回0，⽗进程返回⼦进程id，出错返回-1

进程调⽤fork，当控制转移到内核中的fork代码后，内核做：
分配新的内存块和内核数据结构给⼦进程
将⽗进程部分数据结构内容拷⻉⾄⼦进程
添加⼦进程到系统进程列表当中
fork返回，开始调度器调度

当⼀个进程调⽤fork之后，就有两个⼆进制代码相同的进程。⽽且它们都运⾏到相同的地⽅。但每个进程都将可以开始它们⾃⼰的旅程，看如下程序。

cpp 复制代码

 int main( void )
 {
 pid_t pid;
 printf("Before: pid is %d\n", getpid());
 if ( (pid=fork()) == -1 )perror("fork()"),exit(1);
 printf("After:pid is %d, fork return %d\n", getpid(), pid);
 sleep(1);
 return 0;
 }        
运⾏结果：
[root@localhost linux]# ./a.out
Before: pid is 43676
After:pid is 43676, fork return 43677
After:pid is 43677, fork return 0

这⾥看到了三⾏输出，⼀⾏before，两⾏after。进程43676先打印before消息，然后它有打印after。另⼀个after消息有43677打印的。注意到进程43677没有打印before，为什么呢？如下图所⽰

所以，fork之前⽗进程独⽴执⾏，fork之后，⽗⼦两个执⾏流分别执⾏。注意，fork之后，谁先执⾏完全由调度器决定。

fork函数返回值

⼦进程返回0
⽗进程返回的是⼦进程的pid

写时拷贝

通常，⽗⼦代码共享，⽗⼦再不写⼊时，数据也是共享的，当任意⼀⽅试图写⼊，便以写时拷⻉的⽅式各⾃⼀份副本。具体⻅下图:

因为有写时拷⻉技术的存在,所以⽗⼦进程得以彻底分离离！完成了进程独⽴性的技术保证! 写时拷⻉,是⼀种延时申请技术,可以提⾼整机内存的使⽤率

fork常规用法

⼀个⽗进程希望复制⾃⼰，使⽗⼦进程同时执⾏不同的代码段。例如，⽗进程等待客⼾端请求，⽣成⼦进程来处理请求。
⼀个进程要执⾏⼀个不同的程序。例如⼦进程从fork返回后，调⽤exec函数。

fork调用失败的原因

系统中有太多的进程
实际⽤⼾的进程数超过了限制

进程终止

进程终⽌的本质是释放系统资源，就是释放进程申请的相关内核数据结构和对应的数据和代码。

进程退出场景

代码运⾏完毕，结果正确
代码运⾏完毕，结果不正确
代码异常终⽌

进程常见退出方法

正常终⽌ （可以通过 **echo $?**查看进程退出码）：

从main返回
调⽤exit
_exit

异常退出

ctrl + c ，信号终⽌

退出码

退出码（退出状态）可以告诉我们最后⼀次执⾏的命令的状态。在命令结束以后，我们可以知道命令是成功完成的还是以错误结束的。其基本思想是，程序返回退出代码 0 时表⽰执⾏成功，没有问题。代码 1 或 0 以外的任何代码都被视为不成功。

Linux Shell 中的主要退出码：

|--------|---------------------------------------------|
| 退出码 | 解释 |
| 0 | 命令成功执行 |
| 1 | 通用错误代码 |
| 2 | 命令 (或参数)使用不当 |
| 126 | 权限被拒绝 (或)无法执行 |
| 127 | 未找到命令，或PATH错误 |
| 128+n | 命令被信号从外部终止，或遇到致命错误 |
| 130 | 通过 Ctrl+C 或 SIGINT 终止 (终止代码2 或键盘中断) |
| 143 | 通过SIGTERM终止 (默认终止) |
| 255/* | 退出码超过了0-255的范围，因此重新计算 (LCTT译注：超过255后，用退出取模) |

退出码 0 表⽰命令执⾏⽆误，这是完成命令的理想状态。
退出码 1 我们也可以将其解释为"不被允许的操作"。例如在没有sudo权限的情况下使⽤ yum；再例如除以 0 等操作也会返回错误码 1 ，对应的命令为 let a=1/0
130 （ SIGINT 或 ^C ）和 143 （ SIGTERM ）等终⽌信号是⾮常典型的，它们属于 128+n 信号，其中 n 代表终⽌码。
可以使⽤strerror函数来获取退出码对应的描述。

_exit函数

cpp 复制代码

#include <unistd.h>
void _exit(int status);
参数：status 定义了进程的终⽌状态，⽗进程通过wait来获取该值

说明：虽然status是int，但是仅有低8位可以被⽗进程所⽤。所以_exit(-1)时，在终端执⾏$?发现返回值是255。

exit函数

cpp 复制代码

#include <unistd.h>
void exit(int status);

exit最后也会调⽤_exit,但在调⽤_exit之前，还做了其他⼯作：

执⾏⽤⼾通过atexit或on_exit定义的清理函数。
关闭所有打开的流，所有的缓存数据均被写⼊
调⽤_exit

cpp 复制代码

 int main()
 {
     printf("hello");
     exit(0);
 }
运⾏结果:
 [root@localhost linux]# ./a.out
 hello[root@localhost linux]#

 int main()
 {
     printf("hello");
     _exit(0);
 }
运⾏结果:
 [root@localhost linux]# ./a.out
 [root@localhost linux]#

return退出

return是⼀种更常⻅的退出进程⽅法。执⾏returnn等同于执⾏exit(n),因为调⽤main的运⾏时函数会将main的返回值当做exit的参数。

进程等待

进程等待必要性

之前讲过，⼦进程退出，⽗进程如果不管不顾，就可能造成'僵⼫进程'的问题，进⽽造成内存泄漏。
另外，进程⼀旦变成僵⼫状态，那就⼑枪不⼊，"杀⼈不眨眼"的kill-9也⽆能为⼒，因为谁也没有办法杀死⼀个已经死去的进程。
最后，⽗进程派给⼦进程的任务完成的如何，我们需要知道。如，⼦进程运⾏完成，结果对还是不对，或者是否正常退出。
⽗进程通过进程等待的⽅式，回收⼦进程资源，获取⼦进程退出信息

进程等待方法

wait方法

cpp 复制代码

 #include<sys/types.h>
 #include<sys/wait.h>
 pid_t wait(int* status);
返回值：
    成功返回被等待进程pid，失败返回-1。
参数：
    输出型参数，获取⼦进程退出状态,不关⼼则可以设置成为NULL

waitpid方法

cpp 复制代码

 pid_ t waitpid(pid_t pid, int *status, int options);
返回值：
    当正常返回的时候waitpid返回收集到的⼦进程的进程ID；
如果设置了选项WNOHANG,⽽调⽤中waitpid发现没有已退出的⼦进程可收集,则返回0；
如果调⽤中出错,则返回-1,这时errno会被设置成相应的值以指⽰错误所在；pid：
参数：
    pid：
        Pid=-1,等待任⼀个⼦进程。与wait等效。
        Pid>0.等待其进程ID与相等的⼦进程。

    status: 输出型参数
            WIFEXITED(status): 若为正常终⽌⼦进程返回的状态，则为真。（查看进程是否是正常退出）
            WEXITSTATUS(status): 若WIFEXITED⾮零，提取⼦进程退出码。（查看进程的退出码options默认为0，表⽰阻塞等待
             WNOHANG: 若pid的⼦进程没有结束，则waitpid()函数返回0，不予以等待。若正常结束，则返回该⼦进程的ID。

如果⼦进程已经退出，调⽤wait/waitpid时，wait/waitpid会⽴即返回，并且释放资源，获得⼦进程退出信息。
如果在任意时刻调⽤wait/waitpid，⼦进程存在且正常运⾏，则进程可能阻塞。
如果不存在该⼦进程，则⽴即出错返回。

获取子进程status

wait和waitpid，都有⼀个status参数，该参数是⼀个输出型参数，由操作系统填充。
如果传递NULL，表⽰不关⼼⼦进程的退出状态信息。
否则，操作系统会根据该参数，将⼦进程的退出信息反馈给⽗进程。
status不能简单的当作整形来看待，可以当作位图来看待，具体细节如下图（只研究status低16 ⽐特位）：

cpp 复制代码

 #include <sys/wait.h>
 #include <stdio.h>
 #include <stdlib.h>
 #include <string.h>
 #include <errno.h>
 int main( void )
 {
     pid_t pid;
     if ( (pid=fork()) == -1 )
         perror("fork"),exit(1);
     if ( pid == 0 ){
         sleep(20);
         exit(10);
     } else {
     int st;
     int ret = wait(&st);
     if ( ret > 0 && ( st & 0X7F ) == 0 ){ // 正常退出
         printf("child exit code:%d\n", (st>>8)&0XFF);
     } else if( ret > 0 ) {  // 异常退出 
    printf("sig code : %d\n", st&0X7F );
     }
  }
}
测试结果：
# ./a.out #等20秒退出
child exit code:10 
# ./a.out #在其他终端kill掉
sig code : 9

阻塞和非阻塞等待

进程的阻塞等待⽅式：

cpp 复制代码

int main()
 {
     pid_t pid;
     pid = fork();
     if(pid < 0){
         printf("%s fork error\n",__FUNCTION__);
         return 1;
         } else if( pid == 0 ){ //child
            printf("child is run, pid is : %d\n",getpid());
            sleep(5);
            exit(257);
        } else{
            int status = 0;
            pid_t ret = waitpid(-1, &status, 0);//阻塞式等待，等待5S 
            printf("this is test for wait\n");
            if( WIFEXITED(status) && ret == pid ){
                        printf("wait child 5s success, child return code is:%d.\n",WEXITSTATUS(status));
                }else{
                        printf("wait child failed, return.\n");
                        return 1;
                }
        }
        return 0;
 }
运⾏结果:
 [root@localhost linux]# ./a.out
 child is run, pid is : 45110
 this is test for wait
 wait child 5s success, child return code is :1.

进程的⾮阻塞等待⽅式：

cpp 复制代码

#include <stdio.h>
 #include <stdlib.h>
 #include <sys/wait.h>
 #include <unistd.h>
 #include <vector>
 typedef void (*handler_t)();      // 函数指针类型
 
std::vector<handler_t> handlers;  // 函数指针数组
 
void fun_one() {
    printf("这是⼀个临时任务1\n");
 }
 void fun_two() {
    printf("这是⼀个临时任务2\n");
 }
 void Load() {
    handlers.push_back(fun_one);
    handlers.push_back(fun_two);
}
 void handler() {
    if (handlers.empty())
        Load();
    for (auto iter : handlers)
        iter();
 }
 int main() {
    pid_t pid;
    pid = fork();
    if (pid < 0) {
        printf("%s fork error\n", __FUNCTION__);
        return 1;
    } else if (pid == 0) {  // child
        printf("child is run, pid is : %d\n", getpid());
        sleep(5);
        exit(1);
    } else {
        int status = 0;
        pid_t ret = 0;
        do {
            ret = waitpid(-1, &status, WNOHANG);  // ⾮阻塞式等待
 
            if (ret == 0) {
                printf("child is running\n");
            }
            handler();
        } while (ret == 0);
        if (WIFEXITED(status) && ret == pid) {
            printf("wait child 5s success, child return code is :%d.\n",
                   WEXITSTATUS(status));
        } else {
            printf("wait child failed, return.\n");
            return 1;
        }
    }
    return 0;
 }

进程程序替换

fork() 之后,⽗⼦各⾃执⾏⽗进程代码的⼀部分如果⼦进程就想执⾏⼀个全新的程序呢？进程的程序替换来完成这个功能！

程序替换是通过特定的接⼝，加载磁盘上的⼀个全新的程序(代码和数据)，加载到调⽤进程的地址空间中！

替换原理

⽤fork创建⼦进程后执⾏的是和⽗进程相同的程序(但有可能执⾏不同的代码分⽀),⼦进程往往要调⽤⼀种exec函数以执⾏另⼀个程序。当进程调⽤⼀种exec函数时,该进程的⽤⼾空间代码和数据完全被新程序替换,从新程序的启动例程开始执⾏。调⽤exec并不创建新进程,所以调⽤exec前后该进程的id并未改变。

替换函数

其实有六种以exec开头的函数,统称exec函数

cpp 复制代码

 #include <unistd.h>
 int execl(const char *path, const char *arg, ...);
 int execlp(const char *file, const char *arg, ...);
 int execle(const char *path, const char *arg, ...,char *const envp[]);
 int execv(const char *path, char *const argv[]);
 int execvp(const char *file, char *const argv[]);
 int execve(const char *path, char *const argv[], char *const envp[]);

函数解释

这些函数如果调⽤成功则加载新的程序从启动代码开始执⾏,不再返回。
如果调⽤出错则返回-1
所以exec函数只有出错的返回值⽽没有成功的返回值。

命名理解

这些函数原型看起来很容易混,但只要掌握了规律就很好记。

l(list) : 表⽰参数采⽤列表
v(vector) : 参数⽤数组
p(path):有p⾃动搜索环境变量PATH
e(env):表⽰⾃⼰维护环境变量

|--------|------|-------|--------------|
| 函数名 | 参数格式 | 是否带路径 | 是否使用当前环境变量 |
| excel | 列表 | 不是 | 是 |
| execlp | 列表 | 是 | 是 |
| execle | 列表 | 不是 | 不是，须自己组装环境变量 |
| execv | 数组 | 不是 | 是 |
| execvp | 数组 | 是 | 是 |
| execve | 数组 | 不是 | 不是，须自己组装环境变量 |

exec调⽤举例如下:

cpp 复制代码

#include <unistd.h>
 int main()
 {
     char *const argv[] = {"ps", "-ef", NULL};
     char *const envp[] = {"PATH=/bin:/usr/bin", "TERM=console", NULL};
     execl("/bin/ps", "ps", "-ef", NULL);
     // 带p的，可以使⽤环境变量PATH，⽆需写全路径
 
    execlp("ps", "ps", "-ef", NULL);
     // 带e的，需要⾃⼰组装环境变量
 
    execle("ps", "ps", "-ef", NULL, envp);
     execv("/bin/ps", argv);
     execvp("ps", argv);
     // 带p的，可以使⽤环境变量PATH，⽆需写全路径
 
    // 带e的，需要⾃⼰组装环境变量
 
    execve("/bin/ps", argv, envp);
    exit(0);
}

事实上,只有execve是真正的系统调⽤,其它五个函数最终都调⽤execve,所以execve在man⼿册第2节, 其它函数在man⼿册第3节。这些函数之间的关系如下图所⽰。

下图exec函数簇⼀个完整的例⼦:

少年没有乌托邦，心向远方自明朗！

如果这个博客对你有帮助，给博主一个免费的点赞就是最大的帮助❤

欢迎各位点赞，收藏 和关注哦❤

如果有疑问或有不同见解，欢迎在评论区留言❤

后续会继续更新大连理工大学 相关课程和有关Linux 的内容和示例

点赞加关注，学习不迷路，好，本次的学习就到这里啦！！！

ok，我们下次再见！