linux 使用gdb 使运行中的python进程中的指定线程抛出异常(kill python线程)

最近运行的python脚本,经常遇到获取某个资源卡住的情况,这个时候想要强行让等待资源的线程结束掉,但是又希望线程结束后,其他的线程能够正常监控到该线程抛出的异常,并且能够继续往下执行,不影响该python脚本进程的执行。

搜索了一下没有搜到答案,但是在文档 zhuanlan.zhihu.com/p/208260624 中搜到了使用ctypes对线程设置抛出异常的方法,该方法使用的是通过ctypes调用cpython原生来实现设置python线程异常的方法,因此基于该方法,尝试使用gdb来将python线程手动设置抛出异常成功,方法如下:

首先上测试代码:

test.py 复制代码
import time
from threading import Thread, current_thread


def func(msg, times):
    for i in range(times):
        print(f"{hex(current_thread().ident)}: {msg}")
        time.sleep(1)


t1 = Thread(target=func, args=(1, 5))
t2 = Thread(target=func, args=(2, 60))
t1.start()
t2.start()

流程:

  1. 通过gdb attach到正在执行的python进程
  2. 打断点到某个想要抛异常的线程上(根据PyThreadState_SetAsyncExc方法的注释,在调用该方法前,需要先hold GIL,所以要先断点到该线程,保证该线程已经hold了GIL,实测如果不断到该线程,会导致python进程段错误core掉)
  3. 调用PyThreadState_SetAsyncExc方法, 来设置线程异常

实际测试结果:

首先,在linux上启动进程

然后打开另一个shell终端,ps -ef 查到正在运行的python进程,使用gdb -p pid的方式attach到python进程

先执行info threads然后找到想要抛异常的线程、gdb的线程id、python线程id,然后执行t tid的命令切到该线程,执行bt看一下栈。

我这里使用的测试代码是循环time.sleep(),因此断点打在time_sleep函数,一般断点打_PyEval_EvalFrameDefault就可以。

使用b time_sleep thread 3,打断在在gdb线程id 3的time_sleep函数, 然后按c,等待gdb执行到断点处

进入断点,也就表示该线程肯定hold了GIL,因此执行设置异常的方法:call (int) PyThreadState_SetAsyncExc(0x7f3ead9fe700, (void *)PyExc_Exception)。 (0x7f3ead9fe700是python线程id,不固定,需要随着变, PyExc_Exception可以按照自己的需要修改异常类型)

大功告成!按q退出gdb

效果:

有抛出异常的线程err打印,2也不再打印。用到实际的测试脚本中也生效!

相关推荐
Petrichor_H_39 分钟前
DAY 31 文件的规范拆分和写法
python
咚咚王者1 小时前
人工智能之编程进阶 Python高级:第九章 爬虫类模块
开发语言·python
深蓝海拓2 小时前
使matplot显示支持中文和负号
开发语言·python
AntBlack2 小时前
AI Agent : CrewAI 简单使用 + 尝试一下股票分析
后端·python·ai编程
一眼万里*e3 小时前
搭建本地deepseek大模型
python
1***Q7843 小时前
PyTorch图像分割实战,U-Net模型训练与部署
人工智能·pytorch·python
二进制的Liao3 小时前
【编程】脚本编写入门:从零到一的自动化之旅
数据库·python·算法·自动化·bash
Dxy12393102164 小时前
Python为什么要使用可迭代对象
开发语言·python
Keep_Trying_Go4 小时前
论文STEERER人群计数,车辆计数以及农作物计数算法详解(pytorch)
人工智能·pytorch·python
gzu_014 小时前
基于昇腾 配置pytorch环境
人工智能·pytorch·python