Linux系统-僵尸&孤儿进程

作者介绍:简历上没有一个精通的运维工程师。希望大家多多关注作者,下面的思维导图也是预计更新的内容和当前进度(不定时更新)。

这是Linux进阶部分的最后一大章。讲完这一章以后,我们Linux进阶部分讲完以后,我们的Linux操作部分就算讲完了,后面的讲解就主要是Linux上的应用软件的讲解,包括虚拟化,容器,云原生,数据库,中间件等。Linux系统相关内容,主要从以下几个方面来讲解:

Linux系统-开关机

Linux系统-单用户模式

Linux系统-救援模式

Linux系统-僵尸&孤儿进程(本章节)

Linux系统-systemd

Linux系统-logrotate

Linux系统-发行版介绍

Linux系统-发行版rocky

Linux系统-发行版ubuntu

Linux系统-初始化

我们在讲Linux进阶命令-top的时候说过,在top里面命令,是可以看到僵尸进程的数量的;在讲Linux进阶命令-ps&kill的时候也讲过,部分进程是无法通过kill -9杀死的,僵尸进程就是其中之一;那么什么是僵尸进程,什么是孤儿进程的呢?

僵尸进程

僵尸进程是指一个已经结束执行(通常是父进程尚未对其执行wait系统调用)的进程,但在进程表中仍有其条目,占用系统资源。

一、产生原因

  1. 子进程先于父进程结束:当子进程结束时,它会向父进程发送一个信号,告知自己已经终止。然而,如果父进程没有及时处理这个信号(通过调用waitwaitpid函数),子进程就会进入僵尸状态。

  2. 父进程未正确处理子进程的结束:父进程可能因为忙于其他任务或者设计缺陷,没有及时处理子进程的结束状态,导致子进程成为僵尸进程。

二、影响

  1. 资源占用:僵尸进程会占用进程表中的一个条目,消耗一定的系统内存资源。虽然单个僵尸进程占用的资源通常较少,但如果系统中存在大量的僵尸进程,可能会导致进程表资源耗尽,影响系统的性能和稳定性。

  2. 系统管理困难:僵尸进程的存在会使系统管理员难以准确了解系统中正在运行的进程状态,增加了系统管理的复杂性。

三、解决方法

  1. 父进程正确处理子进程的结束:父进程应该及时调用waitwaitpid函数来处理子进程的结束状态,回收子进程的资源。这可以确保子进程在结束后不会成为僵尸进程。

  2. 使用信号处理:父进程可以设置信号处理函数来捕获子进程结束时发送的信号,然后在信号处理函数中调用waitwaitpid函数来处理子进程的结束状态。

  3. 重启父进程:如果父进程无法正确处理子进程的结束状态,可以考虑重启父进程。这将导致所有的子进程被终止,由系统自动回收它们的资源,从而消除僵尸进程。(简单来说就是结束父进程)。

四、案例

python 复制代码
import os
import time

pid = os.fork()
if pid == 0:
    # 子进程
    print(f'子进程:我的 PID 是 {os.getpid()}')
    os._exit(0)
else:
    # 父进程
    print(f'父进程:我的 PID 是 {os.getpid()},子进程 PID 是 {pid}')
    time.sleep(110)

查看僵尸进程的命令。

bash 复制代码
ps -eo pid,ppid,stat,cmd | awk '$3~/^Z/{print}'

孤儿进程

孤儿进程是指在其父进程结束后仍在运行的子进程。

一、产生过程

  1. 当一个父进程创建了一个子进程后,如果父进程在子进程还在运行时意外终止,那么这个子进程就会成为孤儿进程。

  2. 例如,父进程可能因为程序错误、被强制终止或者正常结束但忘记等待子进程等原因而先于子进程结束。

二、系统处理方式

  1. 当一个进程成为孤儿进程后,系统中的 init 进程(进程号为 1)会自动成为该孤儿进程的新父进程。

  2. init 进程会负责监控和清理孤儿进程。当孤儿进程结束时,init 进程会回收其占用的资源。

三、影响

  1. 通常情况下,孤儿进程不会对系统造成严重的不良影响。因为 init 进程会接管它们,确保资源得到合理的回收。

  2. 但是,如果系统中存在大量的孤儿进程,可能会消耗一定的系统资源,尤其是在创建和回收进程的过程中会产生一些开销。

四、案例

python 复制代码
import multiprocessing
import time
from flask import Flask

app = Flask(__name__)

def web_service():
    try:
        app.run()
    except KeyboardInterrupt:
        pass

if __name__ == '__main__':
    child_process = multiprocessing.Process(target=web_service)
    child_process.start()
    time.sleep(15)
    print("主进程退出。")
    # 主进程退出时不影响子进程继续运行
    multiprocessing.active_children()
    import os
    os._exit(0)

正常运行情况

形成孤儿进程

19414进程原来是19410的子进程,现在19410结束了,现在他被init 1号进程接管,他还继续运行。

这个时候,还可以继续提供服务,但是我们无法通过主进程来停止子进程,因为父进程已经结束,就只能通过kill命令来关闭他。

总结

  1. 僵尸进程是已经结束但父进程未回收其资源的进程,而孤儿进程是父进程已结束但自身仍在运行的进程。

  2. 僵尸进程不会占用cpu和内存资源,但是他会占用进程表资源,而孤儿进程会被 init 进程接管,他会继续提供服务。

  3. 一般而言,僵尸进程数量较少的情况我们不需要关注,但是需要知道它是由谁产生的。而孤儿进程由于他在继续提供服务,我们平时都可能较少关注到他。

运维小路

一个不会开发的运维!一个要学开发的运维!一个学不会开发的运维!欢迎大家骚扰的运维!

关注微信公众号《运维小路》获取更多内容。

相关推荐
甲鱼92915 小时前
MySQL 实战手记:日志管理与主从复制搭建全指南
运维
Johny_Zhao1 天前
OpenClaw安装部署教程
linux·人工智能·ai·云计算·系统运维·openclaw
NineData1 天前
数据库迁移总踩坑?用 NineData 迁移评估,提前识别所有兼容性风险
数据库·程序员·云计算
chlk1233 天前
Linux文件权限完全图解:读懂 ls -l 和 chmod 755 背后的秘密
linux·操作系统
舒一笑3 天前
Ubuntu系统安装CodeX出现问题
linux·后端
改一下配置文件3 天前
Ubuntu24.04安装NVIDIA驱动完整指南(含Secure Boot解决方案)
linux
碳基沙盒3 天前
OpenClaw 多 Agent 配置实战指南
运维
深紫色的三北六号3 天前
Linux 服务器磁盘扩容与目录迁移:rsync + bind mount 实现服务无感迁移(无需修改配置)
linux·扩容·服务迁移
SudosuBash3 天前
[CS:APP 3e] 关于对 第 12 章 读/写者的一点思考和题解 (作业 12.19,12.20,12.21)
linux·并发·操作系统(os)
哈基咪怎么可能是AI4 天前
为什么我就想要「线性历史 + Signed Commits」GitHub 却把我当猴耍 🤬🎙️
linux·github