debug 笔记:llama 3.2 部署bug 之cutlassF: no kernel found to launch!

1 问题描述

按照官方的写法

python 复制代码
import torch
from transformers import pipeline
import os
os.environ["HF_TOKEN"] = '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'
model_id = "meta-llama/Llama-3.2-3B"

pipe = pipeline(
    "text-generation", 
    model=model_id, 
    torch_dtype=torch.bfloat16, 
    device_map="auto"
)

pipe("The key to life is")

2 解决方法

python 复制代码
torch.backends.cuda.enable_mem_efficient_sdp(False)
torch.backends.cuda.enable_flash_sdp(False)

禁用 PyTorch 2.x 中默认启用的 Flash Attention 和 Memory-Efficient Attention 内核

相关推荐
wdfk_prog20 小时前
[Linux]学习笔记系列 -- [fs]mnt_idmapping
linux·笔记·学习
CYTElena21 小时前
关于JAVA异常的笔记
java·开发语言·笔记·语言基础
代码游侠21 小时前
学习笔记——HTML网页开发基础
运维·服务器·开发语言·笔记·学习·html
代码游侠21 小时前
应用——基于C语言实现的简易Web服务器开发
运维·服务器·c语言·开发语言·笔记·测试工具
week_泽21 小时前
OCR学习笔记,调用免费百度api
笔记·学习·ocr
week_泽21 小时前
离线OCR笔记及代码
笔记·ocr
Aliex_git21 小时前
内存堆栈分析笔记
开发语言·javascript·笔记
航Hang*1 天前
第三章:网络系统建设与运维(中级)——交换技术
运维·笔记·计算机网络·华为·ensp·交换机
航Hang*1 天前
第一章:网络系统建设与运维(高级)—— 多区域OSPF路由协议
运维·服务器·网络·笔记·智能路由器·ensp
弘毅 失败的 mian1 天前
Git 多人协作
经验分享·笔记·git