【Linux】信号

🌈个人主页: 秦jh__https://blog.csdn.net/qinjh_?spm=1010.2135.3001.5343
🔥 系列专栏: https://blog.csdn.net/qinjh_/category_12625432.html

目录

信号和信号量

信号

信号的处理

信号捕捉

信号的产生

系统调用

signal

raise

abort

由软件条件产生信号

alarm

硬件异常产生信号

Core、Term

阻塞信号

信号其他相关常见概念

在内核中的表示

sigset_t

信号集操作函数

sigprocmask

sigpending

捕捉信号

内核如何实现信号的捕捉

sigaction

可重入函数

volatile

SIGCHLD信号


前言

💬 hello! 各位铁子们大家好哇。

今日更新了Linux信号的内容

🎉 欢迎大家关注🔍点赞👍收藏⭐️留言📝

信号和信号量

二者之间没有任何关系。

信号

通过kill -l可以查看所有信号

其中,1-31号信号是普通信号。34以上的信号为实时信号。

这些信号各自在什么条件下产生,默认的处理动作是什么,在signal(7)中都有详细说明: man 7 signal
基本结论:

信号:Linux系统提供的一种,向指定进程发送特定事件的方式。

信号的产生和进程是异步的。即进程不知道什么时候会收到信号。

信号可以随时产生。

如果进程做着别的事,可以暂不处理信号,等到合适的时候再处理。

信号的处理

信号处理有三种情况:

  1. 默认动作
  2. 忽略动作
  3. 自定义处理--信号的捕捉

信号捕捉

signal

运行上面代码,在另一个终端上输入kill -2 指令,数字也可换成对应的宏名称。发现输出了hander函数的内容。

signal是用来进行信号捕捉的。参数1是信号的编号,参数2是函数指针。如果进程收到参数1对应的信号,就会执行参数2对应的方法。

可以对多个信号进行捕捉,

由上图,2号信号的默认动作是终止进程。上面没有对2号信号(SIGINT)进行捕捉,就会执行2号信号的默认动作。

我们对2号信号进行捕捉。然后按ctrl+c。发现执行了hander函数。所以实际上,在命令行上按ctrl+c就是给进程发送2号信号。

在命令行上按ctrl+\就是发送3号信号。他们都是用来终止进程的。
信号的保存和发送理解:

进程pcb中,是用位图来保存信号的。收到什么信号,就把对应比特位上的数字变为1。

发送信号:修改指定进程pcb中的信号的指定位图的比特位。

信号的产生

信号的产生方式:

  1. 通过kill命令,向指定进程发送指定信号
  2. 键盘可以产生信号。ctrl+c(SIGINT)、ctrl+\(SIGQUIT)
  3. 系统调用
  4. 软件条件
  5. 异常

系统调用

kill

参数1是指定进程,参数2是指定信号。作用是向指定进程发送指定信号。

如上图,一个循环打印,另一个用kill函数。运行结果如下图,使用kill函数终止了进程。

raise

作用:谁调用这个函数,它就给调用者发送指定信号。

kill是给任意进程发送任意信号。如果想给自己发送信号,相当于kill(getpid(),sig)==raise(sig)

上面是用raise来给自己发送信号的例子。

raise不重要,kill重要。

abort

运行上面代码,两秒后进程就终止了。

abort相当于6号信号。作用是给自己发送6号信号(SIGABRT),终止进程。

运行代码,发现打印了一次后就终止了,不会因为自定义捕捉而一直打印下去。所以它是一个例外。

如果我们把所有信号都捕捉了,是不是就无法关闭进程了?

其实不会,上面的例子就是证明,实际上,还有别的信号可以关闭进程,如9号信号。9号信号不允许自定义捕捉。
上面讲的都是信号产生的方式,都是通过用户完成的。但是真正发送信号的只有一个人:系统。

因为发送信号的本质是修改进程pcb中的信号位图,只有OS才有资格修改。

由软件条件产生信号

SIGPIPE是一种由软件条件产生的信号。下面介绍alarm函数和SIGALRM信号。

alarm

调用alarm函数可以设定一个闹钟,也就是告诉内核在seconds秒之后给当前进程发SIGALRM信号, 该信号的默认处理动 作是终止当前进程。

运行结果如下图:

我们修改代码成如下:

我们让循环单纯++,不再打印,直到闹钟响了再打印。结果发现cnt的值比前面大了很多。这是因为IO很慢。

alarm(0)表示0秒后超时,也就是时间是当前时间。所以alarm(0)表示取消闹钟。alarm返回值是上一个闹钟的剩余时间。

如上图,表示4秒后取消前一个10秒的闹钟,设置一个2秒的新闹钟。

由上图结果可得,闹钟设置一次,默认就触发一次。

我们在hander里面也设置闹钟,相当于每次闹钟响了,就再设置一个闹钟,这样就有了一个常设性的闹钟了。

硬件异常产生信号

运行上面代码都会崩溃,一个是除以0,一个是野指针。 一个报浮点数错误,另一个报段错误。崩溃了会退出,默认是终止进程。

之所以崩溃,是因为非法访问、操作,导致OS向进程发送信号了。

除以0,会发送8号信号(SIGFPE)。野指针会发送11号(SIGSEGV)。

如上图,我们将8号信号捕捉,运行代码后发现,会死循环一直打印 。

再将注释互换,如下图,结果也是死循环打印。

所以程序崩溃了可以不退出,通过捕获异常即可。但是推荐终止进程。

寄存器只有一套,但是寄存器里的数据是属于每一个进程的---硬件的上下文保存和恢复。

如果我们捕获异常,不让进程退出,进程就要调度,进程要调度就得切换。进程要切换,就会把cpu里的寄存器值作保存和恢复。这意味着每次保存进程,就会把异常保存起来,因为进程不退,又会把异常恢复。所以OS就会一直触发错误,就会一直循环打印了。

因此推荐终止进程,本质是为了释放进程的上下文数据。

Core、Term

Core、Term都是终止进程的意思,那他们有啥区别呢?

Term:异常终止

Core:异常终止,但是它会帮我们形成一个类似debug文件。

运行上面代码,结果报错了。也并没有形成类似的debug文件。因为该功能默认是关闭的。

如何查看呢?指令 ulimit -a 可以查看系统中对于普通用户能使用资源对应的限制。下面可以看到core file size 大小是0,所以云服务器默认不允许我们形成core文件。

通过ulimit -c 数字 指令,这样core file选项就打开了。此时再运行程序,就有core文件了。

Core文件就是进程退出时候的镜像数据,这个功能叫核心转储。

核心转储其实是进程异常时,核心数据转而存储到磁盘上。

所以上面图中,core dump标志位为0时表示没有核心转储,为1表示有核心转储。

如果进程是Term就没有核心转储。如果是Core并且打开了核心转储功能,就有核心转储。

我们把Makefile文件里g++带上-g选项,允许被调试。

当程序里面有除0错误时,并且有了core文件。我们gdb进行调试。 输入 core-file core 给gdb加载core文件,我们就可以直接定位到程序出错的地方。

所以core是协助我们进行debug的文件,这种操作也叫事后调试。

运行代码,结果core dump是0。8号信号的终止动作是core,为什么这里结果是0?因为core功能默认是关闭的,我们没打开。打开功能后结果就是1了。

阻塞信号

信号其他相关常见概念

  • 实际执行信号的处理动作称为信号递达 (Delivery)
  • 信号从产生到递达之间的状态,称为信号未决(Pending)。
  • 进程可以选择阻塞 (Block )某个信号。阻塞和有没有未决,二者没有关系
  • 被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作.
  • 注意,阻塞和忽略是不同的,只要信号被阻塞就不会递达,而忽略是在递达之后可选的一种处理动作。

在内核中的表示

信号在内核中的表示示意图

每个进程pcb中会维护三张表。

pending表就是未决表,它是一张位图。有32个比特位,使用其中31位。 假设最左边一位不用,从右往左数,第几个比特位就代表第几个信号。为1就是处于未决状态,为0则不处于。

handler表就是函数指针数组。handler表里面写的就是该信号如何被处理,信号的编号就是数组的下标。

因此我们之前的signal函数调用,如signal(2,handler)就表示用2号编号在handler数组里索引,把自己写的handler函数地址传进handler表里,这样系统就知道你要怎么处理对应信号了。

block表也是一张位图,和pending表类型一样,也只使用其中31位。

这三张表要横着,对应着编号看。

因此,两张位图+一张函数指针数组就可以让进程识别信号。

sigset_t

每个信号只有一个bit的未决标志,非0即1,不记录该信号产生了多少次,阻塞标志也是这样表示的。 因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储,sigset_t称为信号集,这个类型可以表示每个信号的"有效"或"无效"状态,在阻塞信号集中"有效"和"无效"的含义是该信号是否被阻塞,而在未决信号集中"有效"和"无效"的含义是该信号是否处于未决状态。 阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的"屏蔽"应该理解为阻塞而不是忽略。

sigset_t就是Linux给用户提供的一个用户级的数据类型,禁止用户直接修改位图。

信号集操作函数

sigset_t类型内部如何存储这些bit依赖于系统实现,从使用者的角度是不必关心的,使用者只能调用以下函数来操作sigset_ t变量

  • int sigemptyset(sigset_t *set); 把位图全部清空
  • int sigfillset(sigset_t *set); 把整个位图全部置1
  • int sigaddset (sigset_t *set, int signo); 把特定信号设置进该集合里。比如信号是5,就是把第五个bit位置1。
  • int sigdelset(sigset_t *set, int signo); 把特定位置置0,如果是1就置0,如果是0就不动
  • int sigismember(const sigset_t *set, int signo); 判断一个信号是否在集合当中

这四个函数都是成功返回0,出错返回-1。

sigismember是一个布尔函数,用于判断一个信号集的有效信号中是否包含某种信号,若包含则返回1,不包含则返回0,出错返回-1。

注意,在使用sigset_ t类型的变量之前,一定要调用sigemptyset或sigfillset做初始化,使信号集处于确定的状态。初始化sigset_t变量之后就可以在调用sigaddset和sigdelset在该信号集中添加或删除某种有效信号。

sigprocmask

调用函数sigprocmask可以读取或更改进程的信号屏蔽字(阻塞信号集)。

返回值:若成功则为0,若出错则为-1

set是输入型参数,oldset是输出型参数。

如果oldset是非空指针,则读取进程的当前信号屏蔽字通过oldset参数传出。如果set是非空指针,则更改进程的信号屏蔽字,参数how指示如何更改。如果oldset和set都是非空指针,则先将原来的信号屏蔽字备份到oldset里,然后根据set和how参数更改信号屏蔽字。假设当前的信号屏蔽字为mask,下表说明了how参数的可选值。

sigpending

sigpending的作用是获取当前进程的pending位图,它的参数是输出型参数。

调用成功则返回0,出错则返回-1。

运行上面代码,发送2号信号后,因为此时2号信号已经被屏蔽了,所以pending位图里2号信号对应位置就由0置1了。

解除信号屏蔽,一般会立即处理当前被解除的信号(如果被pending)

pending位图对应的信号也要清0,在信号递达之前。

完整代码

cpp 复制代码
#include <iostream>
#include <unistd.h>
#include <cstdio>
#include <sys/types.h>
#include <sys/wait.h>

void PrintPending(sigset_t &pending)
{
    std::cout << "curr process[" << getpid() << "]pending: ";
    for (int signo = 31; signo >= 1; signo--)
    {
        if (sigismember(&pending, signo))
        {
            std::cout << 1;
        }
        else
        {
            std::cout << 0;
        }
    }
    std::cout << "\n";
}

void handler(int signo)
{
    std::cout << signo << " 号信号被递达!!!" << std::endl;

    std::cout << "-------------------------------" << std::endl;
    sigset_t pending;
    sigpending(&pending);
    PrintPending(pending);
    std::cout << "-------------------------------" << std::endl;
}

int main()
{
    // 0. 捕捉2号信号
    signal(2, handler); // 自定义捕捉
    signal(2, SIG_IGN); // 忽略一个信号
    signal(2, SIG_DFL); // 信号的默认处理动作

    // 1. 屏蔽2号信号
    sigset_t block_set, old_set;
    sigemptyset(&block_set);
    sigemptyset(&old_set);
    sigaddset(&block_set, SIGINT); 
    // 1.1 设置进入进程的Block表中
    sigprocmask(SIG_BLOCK, &block_set, &old_set); // 真正的修改当前进行的内核block表,完成了对2号信号的屏蔽!

    int cnt = 15;
    while (true)
    {
        // 2. 获取当前进程的pending信号集
        sigset_t pending;
        sigpending(&pending);

        // 3. 打印pending信号集
        PrintPending(pending);
        cnt--;

        // 4. 解除对2号信号的屏蔽
        if (cnt == 0)
        {
            std::cout << "解除对2号信号的屏蔽!!!" << std::endl;
            sigprocmask(SIG_SETMASK, &old_set, &block_set);
        }

        sleep(1);
    }
}

捕捉信号

如果一个信号不做任何处理,它默认就是SIG_DFL选项。

SIG_IGN选项就是忽略一个信号。

内核如何实现信号的捕捉

如果信号的处理动作是用户自定义函数,在信号递达时就调用这个函数,这称为捕捉信号。由于信号处理函数的代码是在用户空间的,处理过程比较复杂,举例如下: 用户程序注册了SIGQUIT信号的处理函数sighandler。 当前正在执行 main函数,这时发生中断或异常切换到内核态。 在中断处理完毕后要返回用户态的main函数之前检查到有信号 SIGQUIT递达。 内核决定返回用户态后不是恢复main函数的上下文继续执行,而是执行sighandler函 数,sighandler和main函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是两个独立的控制流程。 sighandler函数返回后自动执行特殊的系统调用sigreturn再次进入内核态。 如果没有新的信号要递达,这次再返回用户态就是恢复main函数的上下文继续执行了。

信号捕捉的过程:要经历4次状态的切换。

在内核态切换回用户态的时候,进行信号的检测和处理。

再谈地址空间

开机时,操作系统是最先加载的软件,所以OS也要在内存中。内核级页表是将内核地址空间和OS之间进行映射的。因此OS本身就在我的进程地址空间中。

如果有多个进程,不会再创建一个新的内核级页表,而是共用一张。

sigaction

sigaction函数可以读取和修改与指定信号相关联的处理动作。调用成功则返回0,出错则返回- 1。signum 是指定信号的编号。act是输入型参数,是结构体类型,结构如上图,这里只了解结构体里的第一行,即函数指针。所以act传的是函数指针。oldact是输出型参数,用来保存旧的结构体。

sigaction本质就是修改信号的handler表。

sigaction跟前面的signal本质作用是一样的,都是对特定信号进行捕捉。

运行后,ctrl+c发送2号信号,发现2号信号被捕捉了,执行了handler函数。

我们把上面的handler函数修改一下,添加sleep。 运行后一直按ctrl+c,发现只执行了一次handler函数。因为当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来 的信号屏蔽字。这样就保证了在处理某个信号时,如果这种信号再次产生,那么 它会被阻塞到当前处理结束为止。

cpp 复制代码
#include<iostream>
#include<signal.h>
#include<unistd.h>

void Print(sigset_t &pending)
{
    for(int sig = 31; sig > 0; sig--)
    {
        if(sigismember(&pending, sig))
        {
            std::cout << 1;
        }
        else
        {
            std::cout << 0;
        }
    }
    std::cout << std::endl;
}

 void handler(int signum)
{
    std::cout << "get a sig: " << signum << std::endl;
    while(true)
    {
        sigset_t pending;
        sigpending(&pending);

        Print(pending);

        sleep(1);
        // sleep(30);
        // break;
    }
    // exit(1);
}

int main()
{
    struct sigaction act, oact;
    act.sa_handler = handler;
    sigemptyset(&act.sa_mask);  // 如果你想在处理2号时(OS对2号自动屏蔽),同时对其他信号也进行屏蔽
    sigaddset(&act.sa_mask,3);
    act.sa_flags = 0;
    sigaction(2, &act, &oact);

    while(true)
    {
        std::cout << "I am a process, pid: " << getpid() << std::endl;
        sleep(1);
    }
    return 0;
}

除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用sa_mask字段说明这些需 要额外屏蔽的信号,当信号处理函数返回时自动恢复原来的信号屏蔽字。代码如上,通过sa_mask字段屏蔽了3号信号。

可重入函数

  • main函数调用insert函数向一个链表head中插入节点node1,插入操作分为两步,刚做完第一步的时候,因为硬件中断使进程切换到内核,再次回用户态之前检查到有信号待处理,于是切换到sighandler函数,sighandler也调用insert函数向同一个链表head中插入节点node2,插入操作的 两步都做完之后从 sighandler返回内核态,再次回到用户态就从main函数调用的insert函数中继续往下执行,先前做第一步之后被打断,现在继续做完第二步。结果是,main函数和sighandler先后向链表中插入两个节点,而最后只有一个节点真正插入链表中了。 node2丢失,内存泄露了。
  • 像上例这样,insert函数被不同的控制流程调用,有可能在第一次调用还没返回时就再次进入该函数,这称为重入,insert函数访问一个全局链表,有可能因为重入而造成错乱,像这样的函数称为不可重入函数,反之, 如果一个函数只访问自己的局部变量或参数,则称为可重入(Reentrant) 函数。

如果一个函数符合以下条件之一则是不可重入的:

  • 调用了malloc或free,因为malloc也是用全局链表来管理堆的。
  • 调用了标准I/O库函数。标准I/O库的很多实现都以不可重入的方式使用全局数据结构。

volatile

运行上面代码,按下ctrl+c后,信号被捕捉,gflag就被修改了,while循环条件为假,程序就结束了。

Linux系统中g++是有各种优化级别的。

默认优化级别是-O0,即没有优化。

优化后,发现按ctrl+c 程序不会结束。因为main执行流判定代码里没有对gflag进行修改,觉得不用每次都从内存拿数据,直接在第一次拿的时候,把gflag的值优化到寄存器里,从此之后,每次while检测只检测寄存器里的值。当收到信号后修改gflag的值,修改的是内存里的gflag,就导致寄存器隐藏了内存中的真实值。这是编译器过度优化导致的问题。

为了保持内存的可见性,就有了volatile关键字。

有了volatile修饰,就没有被优化的问题了。

volatile的作用:保持内存的可见性,告知编译器,被该关键字修饰的变量,不允许被优化,对该变量的任何操作,都必须在真实的内存中进行操作

SIGCHLD信号

子进程在终止时会给父进程发SIGCHLD信号,该信号的默认处理动作是忽略,父进程可以自定义SIGCHLD信号的处理函数,这样父进程只需专心处理自己的工作,不必关心子进程了,子进程终止时会通知父进程,父进程在信号处理函数中调用wait清理子进程即可。

如果有多个子进程同时退出,此时会同一时间向父进程发送多个SIGCHLD信号。普通信号是用pending位图接收信号的,收到了多个SIGCHLD信号,但pending位图只会记录一次,导致最后只会回收一个子进程。所以waitpid等待时,外面需要套一层while循环,不断回收。

如果有的子进程退出,有的永远不退出,此时就要用非阻塞等待。否则就会阻塞在信号捕捉里,父进程永远做不了别的事情。


wait和waitpid函数清理僵尸进程,父进程可以阻塞等待子进程结束,也可以非阻塞地查询是否有子进 程结束等待清理(也就是轮询的方式)。采用第一种方式,父进程阻塞了就不能处理自己的工作了;采用第二种方式,父进程在处理自己的工作的同时还要记得时不时地轮询一下,程序实现复杂。

要想不产生僵尸进程还有另外一种办法:父进程调用signal将SIGCHLD的处理动作置为SIG_IGN,这样fork出来的子进程在终止时会自动清理掉,不会产生僵尸进程,也不会通知父进程。

系统默认的忽略动作和用户用signal函数自定义的忽略通常是没有区别的,但这是一个特例。此方法对于Linux可用,但不保证 在其它UNIX系统上都可用。

如果不关心子进程的退出信息,不想产生僵尸进程,就可以用这样做。

相关推荐
Christal_pyy12 分钟前
树莓派4基于Debian GNU/Linux 12 (Bookworm)添加多个静态ipv4网络
linux·网络·debian
csbDD1 小时前
2025年网络安全(黑客技术)三个月自学手册
linux·网络·python·安全·web安全
李狗蛋儿啊1 小时前
zero自动化框架搭建---Git安装详解
运维·git·自动化
小金的学习笔记2 小时前
如何在本地和服务器新建mysql用户和密码
运维·服务器·mysql
s_fox_2 小时前
nginx ngx_http_module(7) 指令详解
运维·nginx·http
EasyNVR2 小时前
EasyRTC智能硬件:实时畅联、沉浸互动、消音护航
运维·服务器·网络·安全·音视频·webrtc·p2p
CarryBest3 小时前
Jenkins 环境搭建---基于 Docker
运维·jenkins
若云止水3 小时前
Ubuntu 下 nginx-1.24.0 源码分析 - ngx_process_options
运维·nginx
s_fox_3 小时前
nginx ngx_http_module(9) 指令详解
运维·nginx·http
风口上的猪20153 小时前
thingboard告警信息格式美化
java·服务器·前端