最近运行的python脚本,经常遇到获取某个资源卡住的情况,这个时候想要强行让等待资源的线程结束掉,但是又希望线程结束后,其他的线程能够正常监控到该线程抛出的异常,并且能够继续往下执行,不影响该python脚本进程的执行。
搜索了一下没有搜到答案,但是在文档 zhuanlan.zhihu.com/p/208260624 中搜到了使用ctypes对线程设置抛出异常的方法,该方法使用的是通过ctypes调用cpython原生来实现设置python线程异常的方法,因此基于该方法,尝试使用gdb来将python线程手动设置抛出异常成功,方法如下:
首先上测试代码:
test.py
import time
from threading import Thread, current_thread
def func(msg, times):
for i in range(times):
print(f"{hex(current_thread().ident)}: {msg}")
time.sleep(1)
t1 = Thread(target=func, args=(1, 5))
t2 = Thread(target=func, args=(2, 60))
t1.start()
t2.start()
流程:
- 通过gdb attach到正在执行的python进程
- 打断点到某个想要抛异常的线程上(根据PyThreadState_SetAsyncExc方法的注释,在调用该方法前,需要先hold GIL,所以要先断点到该线程,保证该线程已经hold了GIL,实测如果不断到该线程,会导致python进程段错误core掉)
- 调用PyThreadState_SetAsyncExc方法, 来设置线程异常
实际测试结果:
首先,在linux上启动进程

然后打开另一个shell终端,ps -ef 查到正在运行的python进程,使用gdb -p pid的方式attach到python进程
先执行info threads然后找到想要抛异常的线程、gdb的线程id、python线程id,然后执行t tid的命令切到该线程,执行bt看一下栈。

我这里使用的测试代码是循环time.sleep(),因此断点打在time_sleep函数,一般断点打_PyEval_EvalFrameDefault就可以。
使用b time_sleep thread 3,打断在在gdb线程id 3的time_sleep函数, 然后按c,等待gdb执行到断点处

进入断点,也就表示该线程肯定hold了GIL,因此执行设置异常的方法:call (int) PyThreadState_SetAsyncExc(0x7f3ead9fe700, (void *)PyExc_Exception)。 (0x7f3ead9fe700是python线程id,不固定,需要随着变, PyExc_Exception可以按照自己的需要修改异常类型)

大功告成!按q退出gdb
效果:

有抛出异常的线程err打印,2也不再打印。用到实际的测试脚本中也生效!