[踩坑]笔记本Ubuntu20.04+NvidiaRTX5060驱动+cuda+Pytorch+ROS/Python实现人脸追踪(环境准备)

1. 华硕天选6笔记本安装英伟达驱动

首先,第一步肯定是安装英伟达显卡驱动。这一步就难倒博主了;在Ubuntu系统20.04尝试过安装很多次,也卸载过很多次英伟达驱动,就是安装不好;有一次把电脑搞死机了;还有一次跟着某CSDN博客,把电脑搞黑屏,只剩一个光标在左上角闪烁。

现在终于搞明白了,参考了下面b站的博主的启发,才发现显卡RTX5060可以试试安装开源版本的驱动。
B站某博主安装开源英伟达驱动教程

安装驱动之前,先把旧的驱动删除;这个东西删了没事;

bash# 复制代码
dpkg -l | grep nvidia

# 检查是否有 NVIDIA 内核模块加载
lsmod | grep nvidia


# 彻底删除所有 nvidia 相关包(包括配置文件)
sudo apt-get purge "nvidia*" "libnvidia*"

# 清理残留依赖和缓存
sudo apt-get autoremove
sudo apt-get autoclean

# 检查是否还有残留包
dpkg -l | grep nvidia

如果是通过run文件安装的旧驱动可以:

bash 复制代码
# 查找并删除 nvidia 相关内核模块
sudo rm -rf /lib/modules/$(uname -r)/kernel/drivers/video/nvidia.ko
sudo rm -rf /lib/modules/$(uname -r)/kernel/drivers/video/nvidia-modeset.ko

# 清理配置文件
sudo rm -f /etc/X11/xorg.conf
sudo rm -rf /usr/local/nvidia*

更新模块

bash 复制代码
sudo update-initramfs -u
sudo depmod -a
sudo reboot#重启

重启后应该内核应该没有nvidia的模块加载才对:

bash 复制代码
lsmod | grep nvidia

如果还有就问一下豆包ai;

英伟达驱动有三种安装方法:

  1. 添加ppa源后,直接在软件和更新中选择对应的驱动,应用更改。
  2. 用命令直接安装二进制的、人家编译好的驱动,然后自己更新的。
  3. 自己去英伟达官网下载run文件
    然后再英伟达官网选驱动的时候,一直推荐的580.xxx的版本,但run文件版本太高,容易跟我的内核5.15.0139起冲突,尝试安装后,驱动加载进内核时失败。

所以第一种方法和第三种方法,容易翻车。博主推荐第二种方法,博主也是自己成功过的。

硬件:显卡RTX5060,CPU任意,ubuntu20.04,内核5.15

bash 复制代码
sudo apt update && sudo apt upgrade -y
sudo add-apt-repository ppa:graphics-drivers/ppa  # 非必需,但可获取更新版本
sudo apt update
sudo apt install nvidia-driver-570-open

不加-open闭源版本博主试过安装了,就是会加载内核失败;如果有高手可以解释一下,小白就不用亲口尝答辩了。

安装过程,建议看着b站教程或者博客,辅助AI,对比一下,明确一些细节。

假如安装成功,先重启

bash 复制代码
sudo reboot

然后输入

bash 复制代码
nvidia-smi

查看是否安装成功,如果出现了这样的输出,说明英伟达驱动安装成功。

至此,英伟达驱动的安装算是告一段落了。

2. 安装cuda

安装cuda版本,博主也是踩坑了;本来想安装了cuda12.1后兼容性更好,没想到,用gpu加速图像推理时,频频发出警告,然后python和yolo推理一直失败。细看警告,原来博主的显卡是RTX5060的新显卡,旧的Pytorch版本根本不认识;看了网上的教程,才知道要用cuda12.8搭配最新的Pytorch(nightly)版本。

英伟达驱动和cuda对应表

博主驱动安装的是570.181,观察到cuda12.8.1才适配,12.8.0反而不适配,所以安装cuda12.8.1;

cuda12.8.1下载官网

bash 复制代码
cd ~
wget https://developer.download.nvidia.com/compute/cuda/12.8.1/local_installers/cuda_12.8.1_570.124.06_linux.run
sudo sh cuda_12.8.1_570.124.06_linux.run
或者
sudo ./cuda_12.8.1_570.124.06_linux.run

由于之前我们已经安装过驱动了,这里就不安装驱动了。但是cuda安装很奇怪,把X当做√来用。

反正光标在driver前两项的X,按空格取消掉。然后下移到install,回车开始安装。

等待。。。

然后安装好后,输入

bash 复制代码
nvcc --version

有四行打印输出,说明cuda可以用了。

将cuda加载进环境变量

在主目录/home,按ctrl+H显示隐藏文件,找到.bashrc文件

打开

在后面加上这几句话:

bash 复制代码
# CUDA 环境变量
export PATH=/usr/local/cuda-12.8/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.8/lib64:$LD_LIBRARY_PATH
export CUDA_HOME=/usr/local/cuda-12.8

使配置生效

bash 复制代码
source ~/.bashrc

3. 开始安装Pytorch,建议提前安装好Anaconda

建议提前自行安装好Anaconda,这里博主也是踩过坑。Anaconda默认是安装在主文件夹,也就是/home,但是之前/home太小,系统重装的时候,给了120G,根目录/分了80G就够了;博主还是装的是双系统。

好,默认大家都看别的教程了,装好了Anaconda了。

现在告诉大家为什么要装cuda12.8.1,除了驱动还有一个原因是RTX5060显卡很新,新到只有最新版本的Pytorch(nightly)才能识别到新显卡,并用sm_120的计算能力进行模型推理。所以接下来会教大家安装Pytorch(nightly)

打开终端

bash 复制代码
conda create -n yologpu python=3.10

安装好后,激活环境

bash 复制代码
conda activate yologpu

左边要是有(yologpu)说明环境激活成功。啰嗦一下,这个环境是指,把很多安装包放进一个个小房间,每个房间都有独立的用处,彼此的安装包互不干扰。

开始装Pytorch(nightly)

去官网:
Pytorch官网

bash 复制代码
pip3 install --pre torch torchvision --index-url https://download.pytorch.org/whl/nightly/cu128

至此大概的环境配置好了。

相关推荐
不爱编程的小陈3 天前
C/C++每日面试题
面试·职场和发展·1024程序员节
开开心心就好3 天前
右键菜单管理工具,添加程序自定义名称位置
linux·运维·服务器·ci/cd·docker·pdf·1024程序员节
码农三叔4 天前
(4-2-05)Python SDK仓库:MCP服务器端(5)Streamable HTTP传输+Streamable HTTP传输
开发语言·python·http·大模型·1024程序员节·mcp·mcp sdk
西幻凌云8 天前
初始——正则表达式
c++·正则表达式·1024程序员节
启芯硬件8 天前
电源XL6009E1的dieshot细节分析-芯片设计干货
大数据·经验分享·硬件工程·1024程序员节
一颗青果10 天前
单例模式 | 死锁
linux·服务器·单例模式·1024程序员节
yBmZlQzJ12 天前
财运到内网穿透域名解析技术机制与中立评估
运维·经验分享·docker·容器·1024程序员节
yBmZlQzJ13 天前
内网穿透工具通过端口转发实现内外网通信
运维·经验分享·docker·容器·1024程序员节