初步诊断:显卡驱动问题
检查显卡型号:
bash
lspci | grep -i vga
输出:
01:00.0 VGA compatible controller: NVIDIA Corporation Device 1f95 (rev a1)
检查当前使用的显卡驱动:
bash
lsmod | grep -E "nvidia|nouveau"
输出:
nouveau 2285568 16
mxm_wmi 16384 1 nouveau
...
结论:系统正在使用开源的 nouveau 驱动,该驱动对 NVIDIA GTX 16xx 系列支持较差,是导致死机的主要原因。
解决方案:安装官方 NVIDIA 驱动
卸载 nouveau 并禁用:
bash
sudo apt remove --purge xserver-xorg-video-nouveau
sudo apt autoremove
sudo bash -c "echo 'blacklist nouveau' >> /etc/modprobe.d/blacklist-nvidia.conf"
sudo bash -c "echo 'options nouveau modeset=0' >> /etc/modprobe.d/blacklist-nvidia.conf"
sudo update-initramfs -u
安装 NVIDIA 驱动(版本 535):
bash
sudo apt install nvidia-driver-535
sudo reboot
验证安装:
bash
lsmod | grep -E "nvidia|nouveau"
输出(成功):
nvidia_uvm 1544192 0
nvidia_drm 77824 8
nvidia_modeset 1306624 13 nvidia_drm
nvidia 56803328 590 nvidia_uvm,nvidia_modeset
...
检查驱动状态:
bash
nvidia-smi
输出:
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.230.02 Driver Version: 535.230.02 CUDA Version: 12.2 |
|-----------------------------------------+----------------------+----------------------+
| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
|=========================================+======================+======================|
| 0 NVIDIA GeForce GTX 1650 Ti Off | 00000000:01:00.0 On | N/A |
| N/A 39C P8 5W / 50W | 354MiB / 4096MiB | 16% Default |
+-----------------------------------------+----------------------+----------------------+
结论:驱动安装成功,nouveau 已被替换,死机问题解决。
后续优化与双系统注意事项
查看显卡工作模式:
bash
prime-select query
输出:
on-demand
说明当前为"按需模式",日常使用集显省电,需要时自动调用独显。
手动指定程序使用独显:
bash
__NV_PRIME_RENDER_OFFLOAD=1 __GLX_VENDOR_LIBRARY_NAME=nvidia 程序名
永久切换显卡模式:
bash
sudo prime-select nvidia # 只用独显
sudo prime-select intel # 只用集显
sudo prime-select on-demand # 按需模式
sudo reboot
Windows 双系统必做:
关闭 Windows 快速启动,避免硬件状态异常:
- 进入 Windows
- 控制面板 → 电源选项 → 选择电源按钮功能
- 点击"更改当前不可用的设置"
- 取消勾选"启用快速启动"
- 保存并关机(不是重启),再进入 Linux
最终状态
- ✅ 系统使用官方 NVIDIA 驱动 535.230.02
- ✅ 不再使用 nouveau 驱动
- ✅ 随机死机问题已彻底修复
- ✅ 显卡性能完全发挥,支持 CUDA 12.2
- ✅ 按需模式平衡性能与续航
附:内核更新后可能需要的修复命令
如果未来 Linux 内核更新后出现无法进入桌面,可执行:
bash
sudo apt install --reinstall nvidia-driver-535
sudo reboot