(4) cuda cudnn TensorRT安装及配置

文章目录

安装显卡驱动

bash 复制代码
# 查看可以安装的驱动
sudo ubuntu-drivers devices
#自己看着选一个
sudo apt install nvidia-drive-525
#验证 有显卡信息输出就正常了
nvidia-smi

cuda安装

CUDA Toolkit下载

  • 30系显卡算力8.6 ; cuda-11.1 -- 11.4算力支持 3.5-8.6
  • cuda-11.8 support for compute capability 3.5 -- 9.0
bash 复制代码
wget https://developer.download.nvidia.com/compute/cuda/11.3.0/local_installers/cuda_11.3.0_465.19.01_linux.run

sudo sh cuda_11.3.0_465.19.01_linux.run
# 只选择cuda tookit安装就行
#安装后会在/usr/local/下生成cuda和cuda-11.3目录 ,cuda是cuda-11.3软连接
#在本机有多个cuda环境时,可以重新软连接切换cuda版本

修改环境变量

bash 复制代码
vim ~/.bashrc
# 在~/.bashrc文本加入下面2句
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin

# 退出~/.bashrc, 生效
source ~/.bashrc
#验证
nvcc -V
# 终端会打印cuda版本信息

cudnn安装

cudnn下载

bash 复制代码
# 8.6.0版本.tar.xz
tar -xf cudnn-linux-x86_64-8.6.0.163_cuda11-archive.tar.xz
# 注意cudnn-linux-x86_64-8.6.0.163_cuda11-archive的路径, 大家解压出来可能文件名不一致,对应自己路径即可
# 1 复制库文件
sudo cp cudnn-linux-x86_64-8.6.0.163_cuda11-archive/lib/* /usr/local/cuda-11.3/lib64/
# 2 复制头文件 
sudo cp cudnn-linux-x86_64-8.6.0.163_cuda11-archive/include/* /usr/local/cuda-11.3/include/

Tensorrt安装

下载
选择GA版本(GA通用版,EA抢先体验版)

bash 复制代码
#解压
tar -xzvf TensorRT-8.6.1.6.Linux.x86_64-gnu.cuda-11.8.tar.gz
#添加环境变量
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/your_path/TensorRT-8.6.1.6/lib
# 重新加载环境变量
source ~/.bashrc
#安装python版
cd /Path/to/TensorRT-8.6.1.6/python
pip install tensorrt-8.6.1-cp38-none-linux_x86_64.whl
#测试python trt
import tensorrt as trt
print(trt.__version__)
#测试
cd /Path/to/TensorRT-8.6.1.6/samples/sampleOnnxMNIST/
make -j8
cd ../../bin
./sample_onnx_mnist
相关推荐
程序猿追2 小时前
那个右下角的小数字怎么“卡”住我打字——我用 HarmonyOS 自己写了一个字数限制输入框
pytorch·华为·harmonyos
闵孚龙4 小时前
《PyTorch 深度修炼》Dataset 和 DataLoader:数据如何喂给模型
人工智能·pytorch·python
bryant_meng9 小时前
【VAE】From Pixels to Faces: Building a VAE from Scratch
pytorch·vae·log-sigma2·重参数
装不满的克莱因瓶10 小时前
了解多标签图像分类方法——从Sigmoid输出到真实世界复杂视觉理解
人工智能·pytorch·python·深度学习·机器学习·分类·数据挖掘
冷小鱼10 小时前
TensorFlow 2.21 进阶实战:从训练优化到生产部署的完整指南
人工智能·pytorch·python·tensorflow
冷小鱼11 小时前
PyTorch 2.12 完全指南:从动态图到编译优化的深度学习框架演进
人工智能·pytorch·深度学习
IRevers11 小时前
【大模型】Gemma4在ROCm和vLLM部署
人工智能·pytorch·深度学习·大模型·datawhale·vllm·amdev
盼小辉丶11 小时前
PyTorch强化学习实战(14)——优先经验回放机制
pytorch·python·深度学习·强化学习
装不满的克莱因瓶11 小时前
【工业领域】了解目标检测评估指标——从mAP到IoU的完整评价体系解析
人工智能·pytorch·python·深度学习·目标检测·计算机视觉·目标跟踪
闵孚龙20 小时前
动态图机制:为什么 PyTorch 调试起来更舒服
人工智能·pytorch·python