目录
进程创建
fork函数初识
在linux中fork函数时非常重要的函数,它从已存在进程中创建一个新进程。新进程为子进程,而原进程为父进程。
#include <unistd.h>
pid_t fork(void);
返回值:子进程中返回0,父进程返回子进程id,出错返回-1
进程调用fork,当控制转移到内核中的fork代码后,内核做:
分配新的内存块和内核数据结构给子进程
将父进程部分数据结构内容拷贝至子进程
添加子进程到系统进程列表当中
fork返回,开始调度器调度
父进程的代码和数据是从磁盘来的,而子进程的代码和数据是没有新加载数据的,所以子进程只能用父进程的代码和数据,代码共享,数据呢以写时拷贝的方式各有一份
具体来说进程=内核的相关管理数据结构(task_struct,mm_struct,+页表)+代码和数据
是先有内核的相关管理数据结构(task_struct,mm_struct,+页表)后有代码和数据
当一个进程调用fork之后,就有两个二进制代码相同的进程。而且它们都运行到相同的地方。但每个进程都将可以 开始它们自己的旅程,看如下程序。
int main( void ) { pid_t pid; printf("Before: pid is %d\n", getpid()); if ( (pid=fork()) == -1 )perror("fork()"),exit(1); printf("After:pid is %d, fork return %d\n", getpid(), pid); sleep(1); return 0; } 运行结果: [root@local linux]# ./a.out Before: pid is 43676 After:pid is 43676, fork return 43677 After:pid is 43677, fork return 0
这里看到了三行输出,一行before,两行after。进程43676先打印before消息,然后它有打印after。另一个after 消息有43677打印的。注意到进程43677没有打印before,为什么呢?如下图所示:
所以,fork之前父进程独立执行,fork之后,父子两个执行流分别执行。注意,fork之后,谁先执行完全由调度器决定。
为什么给父进程返回子进程pid而给子进程返回0?
因为方便父进程对子进程进行标识进而进行管理。父进程有了子进程的pid可以kill或管理它,给子进程返回0正常因为是新开辟的通过0判断是否开辟成功。
写时拷贝
通常,父子代码共享,父子再不写入时,数据也是共享的,当任意一方试图写入,便以写时拷贝的方式各自一份副本。
fork常规用法
一个父进程希望复制自己,使父子进程同时执行不同的代码段。例如,父进程等待客户端请求,生成子进程来处理请求。
一个进程要执行一个不同的程序。例如子进程从fork返回后,调用exec函数。
fork调用失败的原因
系统中有太多的进程(消耗太多内存空间)
实际用户的进程数超过了限制(每个用户的进程数是有限的,万一太多出问题)
进程终止
终止是在做什么?
其实就是释放曾经进程的代码和数据所占用的空间--释放内存
释放内核数据结构
进程终止的三种情况
a:代码跑完,结果正确
b:代码跑完,结果不正确-------代码结果正确不正确可以通过进程退出结果得出
c:代码执行时,出现异常,提前退出
异常:vs编译运行时,崩溃了--os发现你的进程做了不该做的事,os杀掉了进程。一旦出现异常,退出码就没有意义了。
进程出异常本质是因为进程收到了os发给进程的信号!
使用命令行工具如 ps、kill 或者编程接口如 waitpid 来获取进程的退出状态码和退出信号。 1. 先确认是否是异常
2. 不是异常,就一定是代码跑完了。看退出码就行
所以衡量一个进程退出,看两个数字:退出码,退出信号
0 0
!0 0
0 !0
!0 !0
四种组合
命令行中的进程都是bash的子进程。
return 0 return 100 退出码可以默认也可以自定义 错误码
如何终止进程
正常终止(可以通过 echo $? 查看进程退出码):
a. main函数return,表示进程终止(非main函数,return,函数结束)
b. 代码调用exit函数,注意:我们代码的任意位置调用exit()都表示进程退出,后面函数不跑了
c. _exit: #include <unistd.h> void _exit(int status);
虽然status是int,但是仅有低8位可以被父进程所用。所以_exit(-1)时,在终端执行$?发现返回值 是255。
进程等待
结论:任何子进程在退出的时候,一般都要被父进程等待。进程在退出的时候,如果父进程不管不顾,退出进程那么就会变成Z状态(僵尸状态),一直处于Z则会内存泄漏
为什么进行进程等待
父进程通过等待,解决子进程退出的僵尸问题,回收系统资源(一定进行的)
获取子进程的退出信息,知道子进程是因为什么原因退出的(可选的功能,可不进行)
怎么进行进程等待
wait方法:
#include<sys/types.h>
#include<sys/wait.h>
pid_t wait(int*status);
返回值:
成功返回被等待进程pid,失败返回-1。
参数:
输出型参数,获取子进程退出状态,不关心则可以设置成为NULL
如果子进程没有退出,那么父进程一直在阻塞等待!等子进程状态发生变化 。
子进程本身就是软件,父进程本质是在等待某种软件就绪,那么如何理解阻塞等待子进程?其实就是阻塞等待子进程是指父进程在执行过程中,通过某种方式等待子进程执行完毕或者终止,并且在等待过程中暂停自己的执行,直到子进程退出或者产生某种事件
waitpid方法:
可指定id和-1任意进程
pid_t rid=waitpid(-1,NULL,0);是等待任何一个进程结束得到pid
id值填错会出现等待错误
如果子进程已经退出,调用wait/waitpid时,wait/waitpid会立即返回,并且释放资源,获得子进程退出信息。
如果在任意时刻调用wait/waitpid,子进程存在且正常运行,则进程可能阻塞。
如果不存在该子进程,则立即出错返回。
获取子进程status
wait和waitpid,都有一个status参数,该参数是一个输出型参数,由操作系统填充。
如果传递NULL,表示不关心子进程的退出状态信息。
否则,操作系统会根据该参数,将子进程的退出信息反馈给父进程。
status不能简单的当作整形来看待,可以当作位图来看待,具体细节如下图(只研究status低16比特 位):
子进程退出要得到两个信息:进程退出码,推出信号。
一个status是32位的,但是我们只考虑低16位
退出码:(status>>8)&0xFF
推出信号:status&0x7F
WIFEXITED(status):程序正常运行完无异常信号
WEXITSTATUS(status):查看退出码
先看有无异常再看退出码
父进程等待是必须的,获得子进程的退出信息不是必须的所以status可以为NULL
阻塞等待:如果子进程没有退出,而父进程在执行waitpid进行等待,那么会一直卡在waitpid那里因为子进程没退 --叫做阻塞等待。比如平常使用的接口scanf,cin,cout等都会涉及一些。阻塞本质就是进程不被调度不在运行队列里面,pcb在等待队列里面,在等待某种条件发生(子进程退出)。父进程什么都没干只是在等。所以waitpid的options值位0代表阻塞等
**非阻塞等待:**非阻塞等待是指在等待某个事件发生时,不会使程序陷入阻塞状态,而是会立即返回,允许程序继续执行其他任务或轮询事件。可以使用
waitpid()
函数实现非阻塞等待子进程退出。通过传入WNOHANG
选项,waitpid()
函数可以在没有可等待的子进程退出时立即返回,而不会阻塞当前进程。pid_t>0:等待成功,子进程退出了,并且父进程回收成功
pid_t<0:等待失败
pid_t==0:检测是成功的,只不过子进程没退出,需要你下一次继续进行重复等待
非阻塞等待的时候+循环=非阻塞轮询------允许父进程做一些其他的事情