【Linux】进程ID和线程ID在日志中的体现

在分析内核打印日志流程的时候,发现有时候同一个进程函数调用关系比较混乱(因为只打印了进程号),现象就是一个函数走着走着不知道走哪里去了。

另一个现象是,在Linux启动Firefox的时候,启了大概80个进程,其实这个时候也有点怀疑:

Linux内核裁剪后编译重启查看日志_哔哩哔哩_bilibili

有点类似开始分析打印日志的时候,有多进程时,如果未把多进程的ID打印出来,是不太容易分析出来函数调用流程的,如下图所示红色方框这个字段,(注意,这图未针对函数调用关系混乱)

本来想的是,会不会是因为进程内多线程函数调用导致?

然后在网上搜索了下:看到一篇文章:

https://zhuanlan.zhihu.com/p/673084366

然后看了下fork.c的copy_process,然后看到创建进程后的pid和tgid的设置,如下图所示:

这里可以看出,在创建进程的时候(实际有可能是线程) ,这个pid是不断变化的,但是如果是创建线程,tgid的值实际上是父进程的值,从上图中可以看出,父进程的tgid值是等于pid的值的(2507行和2516行)。

那么在原有的日志打印宏基础上需要添加task_struct->pgid的值,并且需要验证是不是这回事(其实原来的宏里已经包含这一字段):

这里需要注意的是:

1、测试的时候打印日志开关:touch LOG_MORE

2、日志增长速度很快,日志打印开关打开了10秒,在这10秒内打开FireFox,然后访问百度,百度网页打开后,马上关闭日志打印:touch LOG_STOP,这个过程持续10多秒,日志63M:

然后查找进程名为:firefox的进程

基于上面的描述,这个进程应该是主进程,再找找看看有没有线程:

等等。

这个pr_info_self打印宏其实还挺厉害,尤其是结合内核裁剪后,说不定更厉害。。。。。

感谢阅读。

相关推荐
ylmzfun14 小时前
CI/CD技术全景解析:从理念到高效落地的自动化流水线
运维·ci/cd·自动化
hjs_deeplearning14 小时前
应用篇#4:Qwen2视觉语言模型(VLM)的服务器部署
服务器·人工智能·python·深度学习·语言模型
Ronin30514 小时前
【Linux网络】数据链路层
linux·网络·数据链路层·arp协议·局域网通信
Aze..14 小时前
PVE安装 Ubuntu 服务器版
运维·服务器·数据库
zt1985q15 小时前
fnOS 飞牛云 NAS 本地部署开源 TTS 文本转语音工具 EasyVoice 并实现外部访问
运维·服务器·网络协议·开源
TroubleBoy丶15 小时前
Docker可用镜像
java·linux·jvm·docker
java_logo15 小时前
PGADMIN4 Docker 容器化部署指南
运维·数据库·docker·postgresql·容器·数据库系统
Xyz996_15 小时前
Keepalived双机热备
linux·运维·服务器
java_logo15 小时前
Apache Kafka Docker 容器化部署指南
运维·docker·云原生·容器·kafka·kubernetes·apache
Han.miracle15 小时前
网络层-IP 协议全景解析:从地址分配到内网穿透,解锁互联网通信底层密码
服务器·网络·网络协议·ip