新拿到一个服务器,发现啥都没有。于是就安装
1.安装驱动
禁用自带显卡驱动nouveau
lsmod | grep nouveau
这个有输出代表该驱动存在
vim /etc/modprobe.d/blacklist.conf
在文件末尾添加
python
blacklist nouveau
options nouveau modeset=0
update-initramfs -u 更新
reboot 重启机器
参考:https://dotatong.com/index.php/archives/117/
apt安装,简单些
先输入,检查机器可以安装哪些版本的
ubuntu-drivers devices
这里最新支持560。
于是
python
add-apt-repository ppa:graphics-drivers/ppa
apt-get update
apt-get install nvidia-driver-560 nvidia-settings nvidia-prime
参考:https://www.cnblogs.com/Maker-Liu/p/16575241.html
nvidia-smi输出结果即为成功。也可以重启机器再看
物理安装
首先下载驱动文件
wget https://cn.download.nvidia.com/XFree86/Linux-x86_64/550.100/NVIDIA-Linux-x86_64-550.100.run
chmod 755 NVIDIA-Linux-x86_64-550.100.run 加执行权限
./NVIDIA-Linux-x86_64-550.100.run -no-x-check 安装
一路点点点
但是我重启了机器后驱动又不见了。
2.cuda安装
先卸载旧的cuda:
python
sudo apt-get --purge remove cuda*
sudo apt-get --purge remove libcudnn*
sudo apt-get --purge remove libnccl*
sudo apt-get --purge remove libcuda*
which nvcc应该不输出
根据其安装,完成后nvcc -V也是找不到。是软连接的问题
python
确保 /usr/local/cuda 指向 CUDA 12.6
sudo rm -rf /usr/local/cuda
sudo ln -s /usr/local/cuda-12.6 /usr/local/cuda
nano ~/.bashrc
将下面两行写入到最下面
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
source ~/.bashrc
成功