运行QWen2-1.5b模型时报错“RuntimeError: cutlassF: no kernel found to launch!”

运行QWen2-1.5b模型时报错"RuntimeError: cutlassF: no kernel found to launch!"

#问题:成功加载QWen2-1.5b模型,但是推理时

"model.generate(

model_inputs.input_ids,

top_p=self.top_p,

max_new_tokens=512

)时",报错"RuntimeError: cutlassF: no kernel found to launch!"

解决方法:

在代码运行的开头加入以下代码即可

import torch

torch.backends.cuda.enable_mem_efficient_sdp(False)

torch.backends.cuda.enable_flash_sdp(False)

参考链接:

https://blog.csdn.net/zc1226/article/details/140213258

https://stackoverflow.com/questions/77803696/runtimeerror-cutlassf-no-kernel-found-to-launch-when-running-huggingface-tran

相关推荐
ZTLJQ8 小时前
序列化的艺术:Python JSON处理完全解析
开发语言·python·json
H5css�海秀8 小时前
今天是自学大模型的第一天(sanjose)
后端·python·node.js·php
阿贵---8 小时前
使用XGBoost赢得Kaggle比赛
jvm·数据库·python
无敌昊哥战神8 小时前
【LeetCode 257】二叉树的所有路径(回溯法/深度优先遍历)- Python/C/C++详细题解
c语言·c++·python·leetcode·深度优先
李昊哲小课10 小时前
第1章-PySide6 基础认知与环境配置
python·pyqt·pyside
老鱼说AI10 小时前
大规模并发处理器程序设计(PMPP)讲解(CUDA架构):第四期:计算架构与调度
c语言·深度学习·算法·架构·cuda
2401_8942419210 小时前
用Pygame开发你的第一个小游戏
jvm·数据库·python
Hello.Reader11 小时前
深度学习 — 从人工智能到深度学习的演进之路(一)
人工智能·深度学习
Zzzz_my11 小时前
正则表达式(RE)
pytorch·python·正则表达式
天天鸭12 小时前
前端仔写了个 AI Agent,才发现大模型只干了 10% 的活
前端·python·ai编程