时隔一年又来更新我的改bug生活啦~
感觉好像没那么讨厌写代码了,有点那种看自己孩子的欣慰!十分神奇啊!感谢自己这半年多时间的休息,不断沉淀和成长
1.去年还能运行今年就报错了RuntimeError: No CUDA GPUs are available
nvidia-smi NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.说明内核端没有加载 nvidia 驱动(nvidia.ko)。
2.应该是最近又有版本升级了,导致的版本不匹配问题。
驱动与当前内核版本不匹配 / 没编译出 ko
现象:升级过 kernel,但忘了重新生成 initramfs & 模块。
需要在底部Terminal里执行以下代码命令(我竟然连这个都不记得了,忘得真快hh)
python
sudo apt install --reinstall linux-headers-$(uname -r) nvidia-driver-525 # 选自己用的版本号
sudo update-initramfs -u
reboot
装完后检查:
python
lsmod | grep nvidia
torch.cuda.is_available() # 应该返回 True
3.复工后第一个搞定!之前的代码又能酷酷跑了,后面就是改进啦~