-
先在终端查看自己的python、torch、cuda的版本
-
在网站上查找对应的文件,下载下来:
Releases · Dao-AILab/flash-attention · GitHub
比如:我是python3.12、torch2.4、cuda 12.1、False
所以我下载的是这个文件:
【python 3.12,下载第三个文件,文件名:cp312对应的python3.12】
- 把这个文件传到你的文件夹里,然后直接
pip install flash_attn-2.8.3.post1+cu12torch2.4cxx11abiFALSE-cp312-cp312-linux_x86_64.whl.zip【也就是pip install 文件名】就ok啦!
