linux 使用gdb 使运行中的python进程中的指定线程抛出异常(kill python线程)

最近运行的python脚本,经常遇到获取某个资源卡住的情况,这个时候想要强行让等待资源的线程结束掉,但是又希望线程结束后,其他的线程能够正常监控到该线程抛出的异常,并且能够继续往下执行,不影响该python脚本进程的执行。

搜索了一下没有搜到答案,但是在文档 zhuanlan.zhihu.com/p/208260624 中搜到了使用ctypes对线程设置抛出异常的方法,该方法使用的是通过ctypes调用cpython原生来实现设置python线程异常的方法,因此基于该方法,尝试使用gdb来将python线程手动设置抛出异常成功,方法如下:

首先上测试代码:

test.py 复制代码
import time
from threading import Thread, current_thread


def func(msg, times):
    for i in range(times):
        print(f"{hex(current_thread().ident)}: {msg}")
        time.sleep(1)


t1 = Thread(target=func, args=(1, 5))
t2 = Thread(target=func, args=(2, 60))
t1.start()
t2.start()

流程:

  1. 通过gdb attach到正在执行的python进程
  2. 打断点到某个想要抛异常的线程上(根据PyThreadState_SetAsyncExc方法的注释,在调用该方法前,需要先hold GIL,所以要先断点到该线程,保证该线程已经hold了GIL,实测如果不断到该线程,会导致python进程段错误core掉)
  3. 调用PyThreadState_SetAsyncExc方法, 来设置线程异常

实际测试结果:

首先,在linux上启动进程

然后打开另一个shell终端,ps -ef 查到正在运行的python进程,使用gdb -p pid的方式attach到python进程

先执行info threads然后找到想要抛异常的线程、gdb的线程id、python线程id,然后执行t tid的命令切到该线程,执行bt看一下栈。

我这里使用的测试代码是循环time.sleep(),因此断点打在time_sleep函数,一般断点打_PyEval_EvalFrameDefault就可以。

使用b time_sleep thread 3,打断在在gdb线程id 3的time_sleep函数, 然后按c,等待gdb执行到断点处

进入断点,也就表示该线程肯定hold了GIL,因此执行设置异常的方法:call (int) PyThreadState_SetAsyncExc(0x7f3ead9fe700, (void *)PyExc_Exception)。 (0x7f3ead9fe700是python线程id,不固定,需要随着变, PyExc_Exception可以按照自己的需要修改异常类型)

大功告成!按q退出gdb

效果:

有抛出异常的线程err打印,2也不再打印。用到实际的测试脚本中也生效!

相关推荐
亓才孓16 分钟前
[Class类的应用]反射的理解
开发语言·python
小镇敲码人25 分钟前
深入剖析华为CANN框架下的Ops-CV仓库:从入门到实战指南
c++·python·华为·cann
摘星编程44 分钟前
深入理解CANN ops-nn BatchNormalization算子:训练加速的关键技术
python
魔芋红茶1 小时前
Python 项目版本控制
开发语言·python
lili-felicity1 小时前
CANN批处理优化技巧:从动态批处理到流水线并行
人工智能·python
一个有梦有戏的人1 小时前
Python3基础:进阶基础,筑牢编程底层能力
后端·python
摘星编程1 小时前
解析CANN ops-nn中的Transpose算子:张量维度变换的高效实现
python
Liekkas Kono1 小时前
RapidOCR Python 贡献指南
开发语言·python·rapidocr
玄同7652 小时前
Python 后端三剑客:FastAPI/Flask/Django 对比与 LLM 开发选型指南
人工智能·python·机器学习·自然语言处理·django·flask·fastapi
爱吃泡芙的小白白2 小时前
环境数据多维关系探索利器:Pairs Plot 完全指南
python·信息可视化·数据分析·环境领域·pairs plot