运行QWen2-1.5b模型时报错“RuntimeError: cutlassF: no kernel found to launch!”

运行QWen2-1.5b模型时报错"RuntimeError: cutlassF: no kernel found to launch!"

#问题:成功加载QWen2-1.5b模型,但是推理时

"model.generate(

model_inputs.input_ids,

top_p=self.top_p,

max_new_tokens=512

)时",报错"RuntimeError: cutlassF: no kernel found to launch!"

解决方法:

在代码运行的开头加入以下代码即可

import torch

torch.backends.cuda.enable_mem_efficient_sdp(False)

torch.backends.cuda.enable_flash_sdp(False)

参考链接:

https://blog.csdn.net/zc1226/article/details/140213258

https://stackoverflow.com/questions/77803696/runtimeerror-cutlassf-no-kernel-found-to-launch-when-running-huggingface-tran

相关推荐
Kaydeon7 分钟前
【AIGC】50倍加速!NVIDIA蒸馏算法rCM:分数正则化连续时间一致性模型的大规模扩散蒸馏
人工智能·pytorch·python·深度学习·计算机视觉·aigc
B站_计算机毕业设计之家28 分钟前
大数据实战:Python+Flask 汽车数据分析可视化系统(爬虫+线性回归预测+推荐 源码+文档)✅
大数据·python·数据分析·flask·汽车·线性回归·预测
晚枫~30 分钟前
零基础快速上手Playwright自动化测试
javascript·python·测试工具·c#·自动化
三年呀44 分钟前
深度剖析Mixture of Experts(MoE)架构:从原理到实践的全面指南
人工智能·深度学习·架构·模型优化·大规模模型
该用户已不存在2 小时前
Python项目的5种枚举骚操作
后端·python
mortimer2 小时前
从 Python+venv+pip 迁移到 uv 全过程 及 处理 torch + cuda 的跨平台指南
pytorch·python·macos
berryyan2 小时前
Windows WSL 环境下配置 Claude Code 非官方账号2233.ai完整教程
人工智能·python
用户8356290780512 小时前
告别冗余:用Python删除PDF中的超链接
后端·python
墨利昂2 小时前
神经网络常用激活函数公式
人工智能·深度学习·神经网络
初级炼丹师(爱说实话版)4 小时前
PGLRNet论文笔记
人工智能·深度学习·计算机视觉