《Linux 信号入门:搞懂 “进程通信的紧急电话” 到底怎么用(初篇)》

**前引:**在 Linux 系统中,信号是进程间 "即时通信" 的核心机制 当你用 Ctrl+C 终止程序、用 kill 命令结束进程,本质都是信号在发挥作用。很多开发者入门时觉得信号 "简单",实际编程时却常踩坑:信号丢失、处理函数重入、竞态条件等问题屡见不鲜。本文将从信号的本质出发,拆解核心原理、常用接口与实战技巧,帮你彻底搞懂信号,避免在进程通信中踩雷!

目录

【一】信号初识

(1)什么是"信号"

(2)"信号"查看

(3)补充:数据从键盘到显示器

【二】发送信号

(1)指令发送

(2)键盘发生

(3)系统调用

(1)kill()最常用

(2)raise()

(3)abort()

(4)异常(硬件发送)

(5)信号(软件发送)

【三】操作系统如何发信号


【一】信号初识

(1)什么是"信号"

"信号"是什么?

"信号"用来给某个进程直接传达的命令,因此"信号"的发出对象为操作系统

那么每个进程都应该知道信号实行的方法。按照理论:被接收"信号"的受体可以选择:

**"默认执行":**直接按照信号的实现方法默认执行

**"不执行":**选择无视信号

**"自定义执行":**不顾具体的信号实行方法,自己按自己的方法实行

(2)"信号"查看

可以执行下面的命令查看所有的信号:可明显发现数字序号和对应的大写字符串其实是宏实现的

cpp 复制代码
kill -l

其中:1~31号信号为普通信号,34~64号信号为实时信号(暂时不了解)

("Ctrl+C"在我们进程死循环时可以强制退出,它对应的实现是 2号信号)

在Linux中,会存在前台进程和后台进程:

前台进程: 直接展现给用户的(默认打开的是 bash 进程),每次登录只能允许一个前台进程存在

**后台进程:**隐藏起来执行的进程

(3)补充:数据从键盘到显示器

我们知道操作系统和硬件之间夹着"驱动程序",键盘输入时对应的"驱动程序"会发生"中断请求"给CPU,CPU接到请求知道了有数据需要从"键盘"读取,它会让操作系统拿数据到对应"缓冲区",待操作系统有时间处理(感觉就是进入运行队列!)就会刷新到"显示器文件","显示器"拿到了数据

【二】发送信号

在学习发生信号的方式之前,我们需要先看一下另一个接口:signal()

(注意:9号信号"强制终止" 和**19号信号"强制暂停"**是无法被替换执行方法的)

cpp 复制代码
#include <signal.h>

// 信号处理函数类型定义(参数为信号编号)
typedef void (*sighandler_t)(int);

// 注册信号处理函数
sighandler_t signal(int signum, sighandler_t handler);

参数:

第一个参数:信号

第二个参数:函数指针(用来自定义一个函数作为参数)

作用:执行该接口后,该信号默认执行方法失效,捕捉该信号执行自定义执行方法(即该函数)

当捕捉到 2 号信号,也就意味着原来 2 号信号的执行方法将不再生效!

例如:

返回值:暂时不关心

(1)指令发送

指令发送即执行:指令发送我们就不多谈了,实行 kill 指令与选项即可

复制代码
kill -序号 进程ID
(2)键盘发生

比如:Ctrl+C(对应2号信号)、Ctrl+\(对应3号信号)

(3)系统调用

下面介绍三个可以发送信号的系统调用接口:你会发现最后两个接口都可以通过 kill()实现!

(1)kill()最常用
cpp 复制代码
#include <signal.h>
#include <sys/types.h>

int kill(pid_t pid, int sig);

参数:

第一个参数:目标进程

第二个参数:要发送的信号编号

返回值:

  • 成功 :返回0
  • 失败 :返回-1,并设置errno

作用:给指定进程发送对应的信号

例如:

(2)raise()
cpp 复制代码
#include <signal.h>

int raise(int sig);

参数:信号编号

返回值:

  • 成功:返回 0
  • 失败:返回非 0(设置errno)

作用:向正在运行的(即调用该函数的进程)进程发送信号

例如:

(3)abort()
cpp 复制代码
#include <stdlib.h>

void abort(void);

参数:无

返回值:无

作用:触发程序的异常退出(发送6号SIGABRT信号)

例如:

(4)异常(硬件发送)

比如代码中出现除0错误,对空指针解引用....下面我们来梳理该类错误的产生过程:

CPU中会存在程序计数器(比如PC指针)用来找到下一行代码(不会干扰其它进程),当CPU知道下一句代码指令是违规的(可能是语法规定有被解析到),就会暂停执行代码,告诉操作系统错误情况(比如错误位置、原因等等),操作系统拿到CPU的反馈错误后再通过信号向该进程发送,用户再通过提示知道错误信息,一般出现信号错误都是很严重的错误,进程会终止,但是在大型的服务器上,会循序重新执行程序,只给你报错误信息!

了解即可:错误信息其实是被保存在 core dump文件(这个是需要手动开启)
难道异常都是由硬件发出吗?当然不是软件也可以,请继续向下看:

(5)信号(软件发送)

以 alarm()函数为例:给当前程序定一个闹钟(到时发送SIGALRM-14号信号

cpp 复制代码
#include <unistd.h>
unsigned int alarm(unsigned int seconds);

参数:设置的秒数(比如5秒,seconds=5)

返回值:上一次设置的定时器剩余的秒数(混淆点)比如:

第一个alarm()函数的返回值应该是0,因为它之前没有闹钟

如果有多个alarm():前一次调用alarm设置的定时器 "还没到期"(还没触发 SIGALRM 信号)时,再次调用alarm。就会覆盖前面的秒数直接执行当前alarm()

例如:

我先设置一个闹钟,alarm(20),然后观察返回值以及验证是否发送的是14号信号:

结果:我发送了两次14号信号,被正常捕捉没有问题。但是20秒后闹钟响了又被捕捉到了

下面验证如果存在多个alarm(),是否会覆盖旧的闹钟秒数:

【三】操作系统如何发信号

操作系统给这个进程发信号,实质是修改 task_struct 中的 int signal 参数:

相关推荐
浮尘笔记1 天前
Java Snowy框架CI/CD云效自动化部署流程
java·运维·服务器·阿里云·ci/cd·自动化
测试修炼手册1 天前
[测试工具] 用 Codex 做测试实战:从需求分析到自动化用例落地
运维·自动化·需求分析
米高梅狮子1 天前
03.网络类服务实践
linux·运维·服务器·网络·kubernetes·centos·openstack
June`1 天前
网络编程时内核究竟做了什么???
linux·服务器·网络
原来是猿1 天前
腾讯云服务器端口开放完全指南
服务器·网络·腾讯云
你的保护色1 天前
【无标题】
java·服务器·网络
楼兰公子1 天前
RK3588 + Linux7.0.3 网络工程调试错误速查手册
linux·网络·3588
Elnaij1 天前
Linux系统与系统编程(9)——自设计shell与基础IO
linux·服务器
IpdataCloud1 天前
稳定的企业级IP数据接口怎么选?可用性指标+离线库高可用方案
运维·网络·tcp/ip
WebGIS开发1 天前
地信职业百科②:GIS运维
运维·gis·就业·转行