ubuntu22.04安装cuda11.5+cudnn8.8.0

因为pytorch1.11.0与cuda版本的关系 需要用到cuda11.5

否则报错

bash 复制代码
"addmm_sparse_cuda" not implemented for Half

cuda11.5.0及以前的版本不会出现这个问题

因此重新安装,步骤如下:

安装CUDA-11.5.0
bash 复制代码
wget https://developer.download.nvidia.com/compute/cuda/11.5.0/local_installers/cuda_11.5.0_495.29.05_linux.run
sudo sh cuda_11.5.0_495.29.05_linux.run
修改路径~/.bashrc
bash 复制代码
export PATH=$PATH:/usr/local/cuda/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export CUDA_HOME=/usr/local/cuda
安装cuDNN-8.8.0

下载路径:

cuDNN Archive | NVIDIA Developer

bash 复制代码
sudo dpkg -i cudnn-local-repo-ubuntu2204-8.8.0.121_1.0-1_amd64.deb

sudo apt-get update

sudo apt-get install libcudnn8=8.8.0.121-1+cuda11.8

sudo apt-get install libcudnn8-dev=8.8.0.121-1+cuda11.8

sudo apt-get install libcudnn8-samples=8.8.0.121-1+cuda11.8
安装完成后可查看
bash 复制代码
cat /usr/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

#define CUDNN_MAJOR 8
#define CUDNN_MINOR 8
#define CUDNN_PATCHLEVEL 0
--
#define CUDNN_VERSION (CUDNN_MAJOR * 1000 + CUDNN_MINOR * 100 + CUDNN_PATCHLEVEL)

/* cannot use constexpr here since this is a C-only file */

表示输出正常!

正确的计算代码应该是
python 复制代码
import torch
a = torch.randn(3,2).half().cuda()
i = torch.LongTensor([[0, 1, 1],  [2, 0, 2]]) 
v = torch.FloatTensor([3, 4, 5]) 
b = torch.sparse.FloatTensor(i, v, torch.Size([2,3])).half().cuda()
b = b.to_sparse_csr()
c = torch.spmm(b, a)
相关推荐
FlightYe2 分钟前
FFmpeg移动端硬解机制
linux·网络·ffmpeg·音视频·实时音视频·视频编解码
长葡萄的叶子3 分钟前
什么是RAG?
人工智能
Profile排查笔记5 分钟前
指纹浏览器环境异常排查:Fingerprint、Profile、Proxy、Session 和 Task Log 怎么看
前端·人工智能·后端·自动化
水木流年追梦10 分钟前
agent面试必备31- AI Agent 核心进阶:工具路由(Tool Routing)
数据库·人工智能·oracle·面试·职场和发展·embedding
Esaka_Forever11 分钟前
Python 完整内存管理机制详解
开发语言·python·spring
Token炼金师11 分钟前
目标的抉择:CLM 称王、MLM 退场、FIM 补刀、多 Token 与多语 —— 预训练目标五辩
人工智能·深度学习·预训练·clm·mlm·fim·mtp
星马梦缘16 分钟前
机器学习与模式识别 第十三章 从线性模型到神经网络 考点压缩
人工智能·pytorch·神经网络·机器学习·激活函数·relu
大鱼>21 分钟前
深度学习入门:神经网络原理与 PyTorch 实战
pytorch·深度学习·神经网络
one_love_zfl21 分钟前
Claude Code 隐私检测事件情况说明及升级指南
人工智能
笨笨没好名字22 分钟前
Leetcode刷题python3版第一周(下)
linux·算法·leetcode