【Linux】进程信号2——阻塞信号，捕捉信号

1.阻塞信号

1.1. 信号其他相关常见概念

在开始内容之前，先介绍一些信号的专业名词：

实际执行信号的处理动作称为信号递达（Delivery）
信号从产生到递达之间的状态，称为信号未决（Pending）（就是收到信号，但没有执行信号对应的动作）
进程可以选择阻塞（Block）某个信号，阻塞的信号就是收到信号，但是一直处于未决状态。
忽略信号也是一种递达动作。
未决就是未决，阻塞就是阻塞。没有收到信号时，依然可以对没有收到的信号阻塞（收到信号后直接就是未决信号）

1.2.阻塞信号集与未决信号集

Linux内核的进程控制块PCB是一个结构体task_struct，除了包含进程id、状态、工作目录、用户id、组id、文件描述符表**、还包含了信号相关的信息，主要指阻塞信号集和未决信号集。**

阻塞信号集：也叫信号屏蔽字 ，将某些信号加入集合，对他们设置屏蔽，当屏蔽某个信号后，再收到该信号，该信号的处理将推后(解除屏蔽后)。

未决信号集:

信号产生，未决信号集中描述该信号的位立刻翻转为1，表信号处于未决状态；当信号被处理对应位翻转回为0，这一时刻往往非常短暂。
信号产生后由于某些原因主要是阻塞不能抵达，这类信号的集合称之为未决信号集。在屏蔽解除前，信号一直处于未决状态。

未决信号集就是没有被处理的信号，未决信号集实际上是一个32位数，每一位代表一个信号，当信号产生的时候，就把对应的位反转为1，如果该信号未被处理就反转回0，处理了就保持为1。

而阻塞信号集会影响到未决信号集，比如说我在阻塞信号集中将2号信号为置为1，也就是将2号信号屏蔽，那么未决信号集中2号信号对应的位就会变为1（未决状态），一直阻塞在这种状态。

内核通过读取未决信号集来判断信号是否应被处理，信号屏蔽字mask可以影响未决信号集，而我们可以在应用程序中自定义set来改变mask来达到屏蔽指定信号的目的。

总结来说，

未决信号集就是当前进程未处理的信号的集合，它是一个32位字，该字的每一个位对应一个信号，如果该位为1表示信号还未被处理，如果改为置为0，表示信号已经被处理或者没有传递该信号。

阻塞信号集，就是对信号进行阻塞或屏蔽设置的一个32位信号屏蔽字，同样每一位对应一个信号，如果某一位设置为1，那么该位对应的信号将被屏蔽，该信号会被延后处理，此时如果信号产生，那么未决信号集中对应的位置1，一直到该信号被解除屏蔽的时候（也就是阻塞信号集中对应位置0），才会去处理该信号，处理完信号，未决信号集中对应位反转回0。

1.3.信号在内核的表示

信号在内核中的表示示意图如下：

**每个信号都有两个标志位分别表示阻塞（block）和未决（pending），还有一个函数指针表示处理动作。**信号产生时，内核在进程控制块中设置该信号的未决标志，直到信号递达才清除该标志。

这里未决代表是否产生的意思！

在上图中，

SIGHUP信号未阻塞也未产生过，当它递达时执行默认处理动作。
**SIGINT信号产生过，但正在被阻塞，所以暂时不能递达。**虽然它的处理动作是忽略，但在没有解除阻塞之前不能忽略这个信号，因为进程仍有机会在改变处理动作之后再接触阻塞。
**SIGQUIT信号未产生过，但一旦产生SIGQUIT信号，该信号将被阻塞，它的处理动作是用户自定义函数sighandler。**如果在进程解除对某信号的阻塞之前，这种信号产生过多次，POSIX.1允许系统递达该信号一次或多次。Linux是这样实现的：普通信号在递达之前产生多次只计一次，而实时信号在递达之前产生多次可以依次放在一个队列里，但是我们这里只讨论普通信号，所以只计1次。

总结一下：

在block位图中，比特位的位置代表某一个信号，比特位的内容代表该信号是否被阻塞。

在pending位图中，比特位的位置代表某一个信号，比特位的内容代表是否收到该信号。

handler表本质上是一个函数指针数组，数组的下标代表某一个信号，数组的内容代表该信号递达时的处理动作，处理动作包括默认、忽略以及自定义。

block、pending和handler这三张表的每一个位置是一一对应的。

1.4.sigset_t

根据信号在内核中的表示方法，每个信号的未决标志只有一个比特位，非0即1，如果不记录该信号产生了多少次，那么阻塞标志也只有一个比特位。

因此，未决和阻塞标志可以用相同的数据类型sigset_t来存储。

在我当前的云服务器中，sigset_t类型的定义如下：（不同操作系统实现sigset_t的方案可能不同）

cpp 复制代码

#define _SIGSET_NWORDS (1024 / (8 * sizeof (unsigned long int)))
typedef struct
{
	unsigned long int __val[_SIGSET_NWORDS];
} __sigset_t;

typedef __sigset_t sigset_t;

sigset_t称为信号集，这个类型可以表示每个信号的"有效"或"无效"状态。

在阻塞信号集中"有效"和"无效"的含义是该信号是否被阻塞。
在未决信号集中"有效"和"无效"的含义是该信号是否处于未决状态。

阻塞信号集也叫做当前进程的信号屏蔽字（Signal Mask），这里的"屏蔽"应该理解为阻塞而不是忽略。

1.5.信号集操作函数

sigset_t类型对于每种信号用一个bit表示"有效"或"无效"，**至于这个类型内部如何存储这些bit则依赖于系统的实现，从使用者的角度是不必关心的，使用者只能调用以下函数来操作sigset_t变量，而不应该对它的内部数据做任何解释，**比如用printf直接打印sigset_t变量是没有意义的。

bash 复制代码

#include <signal.h>
typedef unsigned long sigset_t; /*信号集类型，其实就是一个32位的字*/

/*清空信号集，将某个信号集清0*/
int sigemptyset(sigset_t *set);

/*填充信号集，将某个信号集置1*/
int sigfillset(sigset_t *set);

/*将某个信号signum加入信号集set*/
int sigaddset(sigset_t *set, int signum);

/*将某个信号清出信号集，从信号集ste中删除信号signum，（其实就是本来某个屏蔽信号字中置1的位清0）*/
int sigdelset(sigset_t *set, int signum);

/*判断某个信号是否在信号集中，
返回值 在集合：1；不在：0；出错：-1 （其余四个函数成功返回0，失败返回-1）*/
int sigismember(const sigset_t *set, int signum);

函数解释：

sigemptyset函数： 初始化set所指向的信号集，使其中所有信号的对应bit清零，表示该信号集不包含任何有效信号。
sigfillset函数： 初始化set所指向的信号集，使**其中所有信号的对应bit置位，**表示该信号集的有效信号包括系统支持的所有信号。
sigaddset函数： 在set所指向的信号集中添加某种有效信号。
sigdelset函数： 在set所指向的信号集中删除某种有效信号。
sigemptyset、sigfillset、sigaddset和sigdelset函数都是成功返回0，出错返回-1。
**sigismember函数：**判断在set所指向的信号集中是否包含某种信号，若包含则返回1，不包含则返回0，调用失败返回-1。

注意：在使用sigset_t类型的变量之前，一定要调用sigemptyset或sigfillset做初始化，使信号处于确定的状态。

例如，我们可以按照如下方式使用这些函数。

cpp 复制代码

#include <stdio.h>
#include <signal.h>

int main()
{
	sigset_t s; //用户空间定义的变量

	sigemptyset(&s);

	sigfillset(&s);

	sigaddset(&s, SIGINT);

	sigdelset(&s, SIGINT);

	sigismember(&s, SIGINT);
	return 0;
}

注意： 代码中定义的sigset_t类型的变量s，与我们平常定义的变量一样都是在用户空间定义的变量，所以后面我们用信号集操作函数对变量s的操作实际上只是对用户空间的变量s做了修改，并不会影响进程的任何行为。

因此，我们还需要通过系统调用，才能将变量s的数据设置进操作系统。

sigprocmask

sigprocmask函数可以用于读取或更改进程的信号屏蔽字（阻塞信号集），该函数的函数原型如下：

cpp 复制代码

#include <signal.h>

int sigprocmask(int how, const sigset_t *set, sigset_t *oldset);

函数功能

sigprocmask() is used to fetch and/or change the signal mask of the calling thread.

**设置阻塞或解除阻塞信号集，用来屏蔽信号或解除屏蔽，其本质是读取或修改进程的PCB中的信号屏蔽字。**需要注意的是，屏蔽信号只是将信号处理延后执行(延至解除屏蔽)；而忽略表示将信号丢弃处理。

函数参数

how：假设当前的信号屏蔽字为mask

SIG_BLOCK：设置阻塞，set表示需要屏蔽的信号，相当于 mask = mask | set 。
SIG_UNBLOCK： 解除阻塞，set表示需要解除屏蔽的信号，相当于 mask = mask & ~set 。
SIG_SETMASK：**替换信号集，set表示用于替代原始屏蔽集的新屏蔽集，相当于 mask = set，**直接把传入的set设置为当前阻塞信号集。调用sigprocmask解除了对当前若干个信号的阻塞，则在sigprocmask返回前，至少将其中一个信号递达。

set：传入参数，是一个位图（32位），set中哪位置1，就表示当前进程屏蔽哪个信号。

oldset：传出参数，保存旧的信号屏蔽集，可用于恢复上次设置。

参数说明：

如果oldset是非空指针，则读取进程当前的信号屏蔽字通过oset参数传出。

如果set是非空指针，则更改进程的信号屏蔽字，参数how指示如何更改。

如果oldset和set都是非空指针，则先将原来的信号屏蔽字备份到oset里，然后根据set和how参数更改信号屏蔽字。

假设当前的信号屏蔽字为mask，下表说明了how参数的可选值及其含义：

返回值说明：

sigprocmask函数调用成功返回0，出错返回-1。

注意： 如果调用sigprocmask解除了对当前若干个未决信号的阻塞，则在sigprocmask函数返回前，至少将其中一个信号递达。

sigpending

sigpending函数可以用于读取进程的未决信号集，该函数的函数原型如下：

cpp 复制代码

#include <signal.h>

int sigpending(sigset_t *set);

sigpending函数读取当前进程的未决信号集，并通过set参数传出。该函数调用成功返回0，出错返回-1。

1.6.示例

实验步骤如下：

先用上述的函数将2号信号进行屏蔽（阻塞）。
使用kill命令或组合按键向进程发送2号信号。
此时2号信号会一直被阻塞，并一直处于pending（未决）状态。
使用sigpending函数获取当前进程的pending信号集进行验证。

cpp 复制代码

#include <stdio.h>
#include <unistd.h>
#include <signal.h>

void printPending(sigset_t *pending)
{
	int i = 1;
	for (i = 1; i <= 31; i++){
		if (sigismember(pending, i)){
			printf("1 ");
		}
		else{
			printf("0 ");
		}
	}
	printf("\n");
}
int main()
{
	sigset_t set, oset;
	sigemptyset(&set);
	sigemptyset(&oset);

	sigaddset(&set, 2); //SIGINT
	sigprocmask(SIG_SETMASK, &set, &oset); //阻塞2号信号

	sigset_t pending;
	sigemptyset(&pending);

	while (1){
		sigpending(&pending); //获取pending
		printPending(&pending); //打印pending位图（1表示未决）
		sleep(1);
	}
	return 0;
}

可以看到，程序刚刚运行时，因为没有收到任何信号，所以此时该进程的pending表一直是全0，而当我们使用kill命令向该进程发送2号信号后，由于2号信号是阻塞的，因此2号信号一直处于未决状态，所以我们看到pending表中的第二个数字一直是1。

为了看到2号信号递达后pending表的变化，我们可以设置一段时间后，自动解除2号信号的阻塞状态，解除2号信号的阻塞状态后2号信号就会立即被递达。因为2号信号的默认处理动作是终止进程，所以为了看到2号信号递达后的pending表，我们可以将2号信号进行捕捉，让2号信号递达时执行我们所给的自定义动作。

cpp 复制代码

#include <stdio.h>
#include <unistd.h>
#include <signal.h>

void printPending(sigset_t *pending)
{
	int i = 1;
	for (i = 1; i <= 31; i++){
		if (sigismember(pending, i)){
			printf("1 ");
		}
		else{
			printf("0 ");
		}
	}
	printf("\n");
}
void handler(int signo)
{
	printf("handler signo:%d\n", signo);
}
int main()
{
	signal(2, handler);
	sigset_t set, oset;
	sigemptyset(&set);
	sigemptyset(&oset);

	sigaddset(&set, 2); //SIGINT
	sigprocmask(SIG_SETMASK, &set, &oset); //阻塞2号信号

	sigset_t pending;
	sigemptyset(&pending);

	int count = 0;
	while (1){
		sigpending(&pending); //获取pending
		printPending(&pending); //打印pending位图（1表示未决）
		sleep(1);
		count++;
		if (count == 20){
			sigprocmask(SIG_SETMASK, &oset, NULL); //恢复曾经的信号屏蔽字
			printf("恢复信号屏蔽字\n");
		}
	}
	return 0;
}

此时就可以看到，进程收到2号信号后，该信号在一段时间内处于未决状态，当解除2号信号的屏蔽后，2号信号就会立即递达，执行我们所给的自定义动作，而此时的pending表也变回了全0。

细节： 在解除2号信号后，2号信号的自定义动作是在打印"恢复信号屏蔽字"之前执行的。因为如果调用sigprocmask解除对当前若干个未决信号的阻塞，则在sigprocmask函数返回前，至少将其中一个信号递达。

2.捕捉信号

2.1.内核空间与用户空间

每一个进程都有自己的进程地址空间，该进程地址空间由内核空间和用户空间组成：

用户所写的代码和数据位于用户空间，通过用户级页表与物理内存之间建立映射关系。
内核空间存储的实际上是操作系统代码和数据，通过内核级页表与物理内存之间建立映射关系。

内核级页表是一个全局的页表，它用来维护操作系统的代码与进程之间的关系。因此，在每个进程的进程地址空间中，用户空间是属于当前进程的，每个进程看到的代码和数据是完全不同的，但内核空间所存放的都是操作系统的代码和数据，所有进程看到的都是一样的内容。

需要注意的是，虽然每个进程都能够看到操作系统，但并不意味着每个进程都能够随时对其进行访问。

如何理解进程切换？

在当前进程的进程地址空间中的内核空间，找到操作系统的代码和数据。
执行操作系统的代码，将当前进程的代码和数据剥离下来，并换上另一个进程的代码和数据。

注意： 当你访问用户空间时你必须处于用户态，当你访问内核空间时你必须处于内核态。

2.2.内核态与用户态

内核态与用户态：

内核态通常用来执行操作系统的代码，是一种权限非常高的状态。
用户态是一种用来执行普通用户代码的状态，是一种受监管的普通状态。

进程收到信号之后，并不是立即处理信号，而是在合适的时候，这里所说的合适的时候实际上就是指，从内核态切换回用户态的时候。

内核态和用户态之间是进行如何切换的？

从用户态切换为内核态通常有如下几种情况：

需要进行系统调用时。
当前进程的时间片到了，导致进程切换。
产生异常、中断、陷阱等。

与之相对应，从内核态切换为用户态有如下几种情况：

系统调用返回时。
进程切换完毕。
异常、中断、陷阱等处理完毕。

其中，由用户态切换为内核态我们称之为陷入内核。每当我们需要陷入内核的时，本质上是因为我们需要执行操作系统的代码，比如系统调用函数是由操作系统实现的，我们要进行系统调用就必须先由用户态切换为内核态。

2.3.内核如何实现信号的捕捉

当我们在执行主控制流程的时候，可能因为某些情况而陷入内核，当内核处理完毕准备返回用户态时，就需要进行信号pending的检查。（此时仍处于内核态，有权力查看当前进程的pending位图）

在查看pending位图时，如果发现有未决信号，并且该信号没有被阻塞，那么此时就需要该信号进行处理。

如果待处理信号的处理动作是默认或者忽略，则执行该信号的处理动作后清除对应的pending标志位，如果没有新的信号要递达，就直接返回用户态，从主控制流程中上次被中断的地方继续向下执行即可。

但如果待处理信号是自定义捕捉的，即该信号的处理动作是由用户提供的，那么处理该信号时就需要先返回用户态执行对应的自定义处理动作，执行完后再通过特殊的系统调用sigreturn再次陷入内核并清除对应的pending标志位，如果没有新的信号要递达，就直接返回用户态，继续执行主控制流程的代码。

注意： sighandler和main函数使用不同的堆栈空间，它们之间不存在调用和被调用的关系，是两个独立的控制流程。

巧计

当待处理信号是自定义捕捉时的情况比较复杂，可以借助下图进行记忆：

其中，该图形与直线有几个交点就代表在这期间有几次状态切换，而箭头的方向就代表着此次状态切换的方向，图形中间的圆点就代表着检查pending表。

当识别到信号的处理动作是自定义时，能直接在内核态执行用户空间的代码吗？

理论上来说是可以的，因为内核态是一种权限非常高的状态，但是绝对不能这样设计。

如果允许在内核态直接执行用户空间的代码，那么用户就可以在代码中设计一些非法操作，比如清空数据库等，虽然在用户态时没有足够的权限做到清空数据库，但是如果是在内核态时执行了这种非法代码，那么数据库就真的被清空了，因为内核态是有足够权限清空数据库的。

也就是说，不能让操作系统直接去执行用户的代码，因为操作系统无法保证用户的代码是合法代码，即操作系统不信任任何用户。

2.4.sigaction

捕捉信号除了用前面用过的signal函数之外，我们还可以使用sigaction函数对信号进行捕捉，sigaction函数的函数原型如下：

cpp 复制代码

int sigaction(int signum, const struct sigaction *act, struct sigaction *oldact);

sigaction函数可以读取和修改与指定信号相关联的处理动作，该函数调用成功返回0，出错返回-1。

参数说明：

signum代表指定信号的编号。
若act指针非空，则根据act修改该信号的处理动作。
若oldact指针非空，则通过oldact传出该信号原来的处理动作。

其中，参数act和oldact都是结构体指针变量，该结构体的定义如下：

cpp 复制代码

struct sigaction {
	void(*sa_handler)(int);
	void(*sa_sigaction)(int, siginfo_t *, void *);
	sigset_t   sa_mask;
	int        sa_flags;
	void(*sa_restorer)(void);
};

结构体的第一个成员sa_handler：

将sa_handler赋值为常数SIG_IGN传给sigaction函数，表示忽略信号。
将sa_handler赋值为常数SIG_DFL传给sigaction函数，表示执行系统默认动作。
将sa_handler赋值为一个函数指针，表示用自定义函数捕捉信号，或者说向内核注册了一个信号处理函数。

注意：所注册的信号处理函数的返回值为void，参数为int，通过参数可以得知当前信号的编号，这样就可以用同一个函数处理多种信号。显然这是一个回调函数，不是被main函数调用，而是被系统所调用。

结构体的第二个成员sa_sigaction：

sa_sigaction是实时信号的处理函数。

结构体的第三个成员sa_mask：

首先需要说明的是，当某个信号的处理函数被调用，内核自动将当前信号加入进程的信号屏蔽字，当信号处理函数返回时自动恢复原来的信号屏蔽字，这样就保证了在处理某个信号时，如果这种信号再次产生，那么它会被阻塞到当前处理结束为止。

如果在调用信号处理函数时，除了当前信号被自动屏蔽之外，还希望自动屏蔽另外一些信号，则用sa_mask字段说明这些需要额外屏蔽的信号，当信号处理函数返回时，自动恢复原来的信号屏蔽字。

结构体的第四个成员sa_flags：

sa_flags字段包含一些选项，这里直接将sa_flags设置为0即可。

结构体的第五个成员sa_restorer：

该参数没有使用。

例如，下面我们用sigaction函数对2号信号进行了捕捉，将2号信号的处理动作改为了自定义的打印动作，并在执行一次自定义动作后将2号信号的处理动作恢复为原来默认的处理动作。

cpp 复制代码

#include <stdio.h>
#include <string.h>
#include <unistd.h>
#include <signal.h>

struct sigaction act, oact;
void handler(int signo)
{
	printf("get a signal:%d\n", signo);
	sigaction(2, &oact, NULL);
}
int main()
{
	memset(&act, 0, sizeof(act));
	memset(&oact, 0, sizeof(oact));

	act.sa_handler = handler;
	act.sa_flags = 0;
	sigemptyset(&act.sa_mask);

	sigaction(2, &act, &oact);
	while (1){
		printf("I am a process...\n");
		sleep(1);
	}
	return 0;
}

运行代码后，第一次向进程发送2号信号，执行我们自定义的打印动作，当我们再次向进程发送2号信号，就执行该信号的默认处理动作了，即终止进程。

3.可重入函数

下面主函数中调用insert函数向链表中插入结点node1，某信号处理函数中也调用了insert函数向链表中插入结点node2，乍眼一看好像没什么问题。

下面我们来分析一下，对于下面这个链表。

1、首先，main函数中调用了insert函数，想将结点node1插入链表，但插入操作分为两步，刚做完第一步的时候，因为硬件中断使进程切换到内核，再次回到用户态之前检查到有信号待处理，于是切换到sighandler函数。

2、而sighandler函数中也调用了insert函数，将结点node2插入到了链表中，插入操作完成第一步后的情况如下：

3、当结点node2插入的两步操作都做完之后从sighandler返回内核态，此时链表的布局如下：

4、再次回到用户态就从main函数调用的insert函数中继续往下执行，即继续进行结点node1的插入操作。

最终结果是，main函数和sighandler函数先后向链表中插入了两个结点，但最后只有node1结点真正插入到了链表中，而node2结点就再也找不到了，造成了内存泄漏。

上述例子中，各函数执行的先后顺序如下：

像上例这样，insert函数被不同的控制流调用（main函数和sighandler函数使用不同的堆栈空间，它们之间不存在调用与被调用的关系，是两个独立的控制流程），有可能在第一次调用还没返回时就再次进入该函数，我们将这种现象称之为重入。

而insert函数访问一个全局链表，有可能因为重入而造成错乱，像这样的函数我们称之为不可重入函数，反之，如果一个函数只访问自己的局部变量或参数，则称之为可重入（Reentrant）函数。

如果一个函数符合以下条件之一则是不可重入的：

调用了malloc或free，因为malloc也是用全局链表来管理堆的。

调用了标志I/O库函数，因为标准I/O库的很多实现都以不可重入的方式使用全局数据结构。

4.volatile

volatile是C语言的一个关键字，该关键字的作用是保持内存的可见性。

在下面的代码中，我们对2号信号进行了捕捉，当该进程收到2号信号时会将全局变量flag由0置1。也就是说，在进程收到2号信号之前，该进程会一直处于死循环状态，直到收到2号信号时将flag置1才能够正常退出。

cpp 复制代码

#include <stdio.h>
#include <signal.h>

int flag = 0;

void handler(int signo)
{
	printf("get a signal:%d\n", signo);
	flag = 1;
}
int main()
{
	signal(2, handler);
	while (!flag);
	printf("Proc Normal Quit!\n");
	return 0;
}

运行结果如下：

该程序的运行过程好像都在我们的意料之中，但实际并非如此。代码中的main函数和handler函数是两个独立的执行流，而while循环是在main函数当中的，在编译器编译时只能检测到在main函数中对flag变量的使用。

此时编译器检测到在main函数中并没有对flag变量做修改操作，在编译器优化级别较高的时候，就有可能将flag设置进寄存器里面。

此时main函数在检测flag时只检测寄存器里面的值，而handler执行流只是将内存中flag的值置为1了，那么此时就算进程收到2号信号也不会跳出死循环。

在编译代码时携带-O3选项使得编译器的优化级别最高，此时再运行该代码，就算向进程发生2号信号，该进程也不会终止。

面对这种情况，我们就可以使用volatile关键字对flag变量进行修饰，告知编译器，对flag变量的任何操作都必须真实的在内存中进行，即保持了内存的可见性。

cpp 复制代码

#include <stdio.h>
#include <signal.h>

volatile int flag = 0;

void handler(int signo)
{
	printf("get a signal:%d\n", signo);
	flag = 1;
}
int main()
{
	signal(2, handler);
	while (!flag);
	printf("Proc Normal Quit!\n");
	return 0;
}

此时就算我们编译代码时携带-O3选项，当进程收到2号信号将内存中的flag变量置1时，main函数执行流也能够检测到内存中flag变量的变化，进而跳出死循环正常退出。

5.SIGCHLD信号

为了避免出现僵尸进程，父进程需要使用wait或waitpid函数等待子进程结束，父进程可以阻塞等待子进程结束，也可以非阻塞地查询的是否有子进程结束等待清理，即轮询的方式。采用第一种方式，父进程阻塞就不能处理自己的工作了；采用第二种方式，父进程在处理自己的工作的同时还要记得时不时地轮询一下，程序实现复杂。

其实，子进程在终止时会给父进程发生SIGCHLD信号，该信号的默认处理动作是忽略，父进程可以自定义SIGCHLD信号的处理动作，这样父进程就只需专心处理自己的工作，不必关心子进程了，子进程终止时会通知父进程，父进程在信号处理函数中调用wait或waitpid函数清理子进程即可。

例如，下面代码中对SIGCHLD信号进行了捕捉，并将在该信号的处理函数中调用了waitpid函数对子进程进行了清理。

cpp 复制代码

#include <stdio.h>
#include <unistd.h>
#include <signal.h>
#include <stdlib.h>
#include <sys/wait.h>

void handler(int signo)
{
	printf("get a signal: %d\n", signo);
	int ret = 0;
	while ((ret = waitpid(-1, NULL, WNOHANG)) > 0){
		printf("wait child %d success\n", ret);
	}
}
int main()
{
	signal(SIGCHLD, handler);
	if (fork() == 0){
		//child
		printf("child is running, begin dead: %d\n", getpid());
		sleep(3);
		exit(1);
	}
	//father
	while (1);
	return 0;
}

注意：

SIGCHLD属于普通信号，记录该信号的pending位只有一个，如果在同一时刻有多个子进程同时退出，那么在handler函数当中实际上只清理了一个子进程，因此在使用waitpid函数清理子进程时需要使用while不断进行清理。
使用waitpid函数时，需要设置WNOHANG选项，即非阻塞式等待，否则当所有子进程都已经清理完毕时，由于while循环，会再次调用waitpid函数，此时就会在这里阻塞住。

此时父进程就只需专心处理自己的工作，不必关心子进程了，子进程终止时父进程收到SIGCHLD信号，会自动进行该信号的自定义处理动作，进而对子进程进行清理。

事实上，由于UNIX的历史原因，要想不产生僵尸进程还有另外一种办法：父进程调用signal或sigaction函数将SIGCHLD信号的处理动作设置为SIG_IGN，这样fork出来的子进程在终止时会自动清理掉，不会产生僵尸进程，也不会通知父进程。系统默认的忽略动作和用户用signal或sigaction函数自定义的忽略通常是没有区别的，但这是一个特列。此方法对于Linux可用，但不保证在其他UNIX系统上都可用。

例如，下面代码中调用signal函数将SIGCHLD信号的处理动作自定义为忽略。

cpp 复制代码

#include <stdio.h>
#include <unistd.h>
#include <signal.h>
#include <stdlib.h>

int main()
{
	signal(SIGCHLD, SIG_IGN);
	if (fork() == 0){
		//child
		printf("child is running, child dead: %d\n", getpid());
		sleep(3);
		exit(1);
	}
	//father
	while (1);
	return 0;
}

此时子进程在终止时会自动被清理掉，不会产生僵尸进程，也不会通知父进程。