linux 使用gdb 使运行中的python进程中的指定线程抛出异常(kill python线程)

最近运行的python脚本,经常遇到获取某个资源卡住的情况,这个时候想要强行让等待资源的线程结束掉,但是又希望线程结束后,其他的线程能够正常监控到该线程抛出的异常,并且能够继续往下执行,不影响该python脚本进程的执行。

搜索了一下没有搜到答案,但是在文档 zhuanlan.zhihu.com/p/208260624 中搜到了使用ctypes对线程设置抛出异常的方法,该方法使用的是通过ctypes调用cpython原生来实现设置python线程异常的方法,因此基于该方法,尝试使用gdb来将python线程手动设置抛出异常成功,方法如下:

首先上测试代码:

test.py 复制代码
import time
from threading import Thread, current_thread


def func(msg, times):
    for i in range(times):
        print(f"{hex(current_thread().ident)}: {msg}")
        time.sleep(1)


t1 = Thread(target=func, args=(1, 5))
t2 = Thread(target=func, args=(2, 60))
t1.start()
t2.start()

流程:

  1. 通过gdb attach到正在执行的python进程
  2. 打断点到某个想要抛异常的线程上(根据PyThreadState_SetAsyncExc方法的注释,在调用该方法前,需要先hold GIL,所以要先断点到该线程,保证该线程已经hold了GIL,实测如果不断到该线程,会导致python进程段错误core掉)
  3. 调用PyThreadState_SetAsyncExc方法, 来设置线程异常

实际测试结果:

首先,在linux上启动进程

然后打开另一个shell终端,ps -ef 查到正在运行的python进程,使用gdb -p pid的方式attach到python进程

先执行info threads然后找到想要抛异常的线程、gdb的线程id、python线程id,然后执行t tid的命令切到该线程,执行bt看一下栈。

我这里使用的测试代码是循环time.sleep(),因此断点打在time_sleep函数,一般断点打_PyEval_EvalFrameDefault就可以。

使用b time_sleep thread 3,打断在在gdb线程id 3的time_sleep函数, 然后按c,等待gdb执行到断点处

进入断点,也就表示该线程肯定hold了GIL,因此执行设置异常的方法:call (int) PyThreadState_SetAsyncExc(0x7f3ead9fe700, (void *)PyExc_Exception)。 (0x7f3ead9fe700是python线程id,不固定,需要随着变, PyExc_Exception可以按照自己的需要修改异常类型)

大功告成!按q退出gdb

效果:

有抛出异常的线程err打印,2也不再打印。用到实际的测试脚本中也生效!

相关推荐
工业互联网专业22 分钟前
基于django+vue的健身房管理系统-vue
vue.js·python·django·毕业设计·源码·课程设计·健身房管理系统
aischang39 分钟前
统信桌面专业版如何使用python开发平台jupyter
开发语言·python·jupyter·统信uos
红鼻子时代42 分钟前
Django RBAC项目后端实战 - 03 DRF权限控制实现
后端·python·django·rabc
敲键盘的小夜猫1 小时前
大模型链路调试平台之LangSmith实战指南
python·langchain
狐凄1 小时前
Python实例题:Python计算概率论
开发语言·python·概率论
Y3174291 小时前
python Day46 学习(日志Day15复习)
python·学习·机器学习
这里有鱼汤1 小时前
一文读懂量化交易中最常用的5种均线,附源码,建议收藏
后端·python
学不会就看1 小时前
selenium学习实战【Python爬虫】
python·学习·selenium
q567315231 小时前
分布式增量爬虫实现方案
开发语言·分布式·爬虫·python
勤奋的知更鸟2 小时前
LLaMA-Factory和python版本的兼容性问题解决
开发语言·python·llama-factory