一次使用threading.Thread来实现Pytorch多个模型并发运行的失败案例

文章目录

背景

我有多个pytorch GPU模型,他们有不同的参数(也就是说不是共享的),但是相同的数据输入,想要并发运行。

不并发运行,当然就是循环喽。

复制代码
        for i in range(self.args.m):
            self.models[i](batch)

我想要并发,因为m有点大。像上面循环的话m=30以上速度就有点受不了了。我看过了,我的GPU还有很多空间,起码放上去10个模型没有问题。

我的做法(但证明不起效果)

我想到了多线程,如下:

复制代码
class MyThread_forward(threading.Thread):  #自定义线程类
    def __init__(self, model,batch):
        threading.Thread.__init__(self)
        self.model = model              
        self.batch=batch
    def run(self):                    
        self.result=self.model(self.batch) 
    def get_result(self): 
        return self.result

def multi_thread_forward():
    threads=[]
    for  i in range(self.args.m):#创建多个线程
        threads.append(MyThread_forward(self.models[i],batch))
    for thread in threads:#各个线程开始并发运行。
        thread.start()
    for thread in threads:#等待各个线程运行完毕再执行下面代码。
        thread.join()    
    results= []
    for thread in threads:
    	results.append(thread.get_result())  #每个线程返回结果(result)加入列表中
    return results
    
multi_thread_forward()#多线程运行。

结果就是不起效果好像,还是运行得很慢,咋回事捏。

相关推荐
yayatiantian_20223 分钟前
Ubuntu 24.04 安装与配置 pyenv
linux·运维·python·ubuntu·pyenv
dajun1811234563 分钟前
加速临床试验与个性化治疗
人工智能
安全二次方security²3 分钟前
CUDA C++编程指南(7.1)——C++语言扩展之函数执行空间指定符
c++·人工智能·nvidia·cuda·cuda编程·global·函数执行空间指定符
小Pawn爷5 分钟前
01.AI对话革命:探索大语言模型的历史和现状
人工智能·语言模型·自然语言处理
June bug18 分钟前
【python基础】常见的数据结构的遍历
开发语言·数据结构·python
摘星星的屋顶18 分钟前
2026年1月19日~2026年1月25日周报
人工智能·深度学习·学习
GAOJ_K23 分钟前
交叉导轨如何避免无效安装
运维·人工智能·科技·自动化·制造
腾视科技26 分钟前
AI NAS:当存储遇上智能,开启数据管理新纪元
大数据·人工智能·ai·nas·ai nas·ainas
深蓝电商API27 分钟前
Selenium Grid分布式执行爬虫任务
爬虫·python·selenium