运行QWen2-1.5b模型时报错“RuntimeError: cutlassF: no kernel found to launch!”

运行QWen2-1.5b模型时报错"RuntimeError: cutlassF: no kernel found to launch!"

#问题:成功加载QWen2-1.5b模型,但是推理时

"model.generate(

model_inputs.input_ids,

top_p=self.top_p,

max_new_tokens=512

)时",报错"RuntimeError: cutlassF: no kernel found to launch!"

解决方法:

在代码运行的开头加入以下代码即可

import torch

torch.backends.cuda.enable_mem_efficient_sdp(False)

torch.backends.cuda.enable_flash_sdp(False)

参考链接:

https://blog.csdn.net/zc1226/article/details/140213258

https://stackoverflow.com/questions/77803696/runtimeerror-cutlassf-no-kernel-found-to-launch-when-running-huggingface-tran

相关推荐
亦陈不染3 分钟前
c#-Halcon入门教程——标定
人工智能·深度学习·计算机视觉
先睡1 小时前
Maven
开发语言·python
赵谨言2 小时前
基于 Python 的学生成绩管理系统设计与实现
经验分享·python·毕业设计
_可乐无糖2 小时前
深度解析 pytest 参数化与 --count 执行顺序的奥秘
android·python·ui·ios·appium·自动化·pytest
Wzt_blog2 小时前
LLM实现视频切片&合成 前沿知识调研
python·音视频
不是二师兄的八戒3 小时前
深入学习 Python 爬虫:从基础到实战
python
CountingStars6193 小时前
梯度下降算法的计算过程
深度学习·算法·机器学习
zhonguncle3 小时前
像JSONDecodeError: Extra data: line 2 column 1 (char 134)这样的问题怎么解决
python·json
云空3 小时前
《英伟达Cosmos:开启物理AI新纪元》
人工智能·深度学习·神经网络·机器人
纪伊路上盛名在4 小时前
在vscode中使用R-1
开发语言·ide·vscode·python·jupyter·r语言·编辑器