运行QWen2-1.5b模型时报错“RuntimeError: cutlassF: no kernel found to launch!”

运行QWen2-1.5b模型时报错"RuntimeError: cutlassF: no kernel found to launch!"

#问题:成功加载QWen2-1.5b模型,但是推理时

"model.generate(

model_inputs.input_ids,

top_p=self.top_p,

max_new_tokens=512

)时",报错"RuntimeError: cutlassF: no kernel found to launch!"

解决方法:

在代码运行的开头加入以下代码即可

import torch

torch.backends.cuda.enable_mem_efficient_sdp(False)

torch.backends.cuda.enable_flash_sdp(False)

参考链接:

https://blog.csdn.net/zc1226/article/details/140213258

https://stackoverflow.com/questions/77803696/runtimeerror-cutlassf-no-kernel-found-to-launch-when-running-huggingface-tran

相关推荐
hakesashou5 分钟前
ruby和python哪个好学
开发语言·python·ruby
Pluses7 分钟前
Datawhale X 李宏毅苹果书 AI夏令营 《深度学习详解》第十九章 ChatGPT
人工智能·笔记·深度学习·学习
NiNg_1_23418 分钟前
Python协程详解
开发语言·python
黑白子200024 分钟前
python定时任务,定时爬取水质和天气
开发语言·python
是小满满满满吗26 分钟前
C++中的继承
开发语言·c++·python
linly12191 小时前
在python中安装HDDM
开发语言·python
洋葱蚯蚓1 小时前
构建自己的文生图工具:Python + Stable Diffusion + CUDA
开发语言·python·stable diffusion
全智能时代2 小时前
宝塔部署python项目
python
kuiini2 小时前
python学习-09【文件和目录操作】
python·学习
炸膛坦客2 小时前
深度学习:(四)python中的广播
人工智能·python·深度学习