一.GPU(图形处理器)核心介绍
GPU 全称为 Graphics Processing Unit,即图形处理器,最初设计目的是高效处理图形渲染相关任务,如今已发展为兼具图形处理与通用并行计算能力的核心硬件,广泛应用于多领域。
从核心定位来看
GPU 与 CPU 差异显著。CPU 是 "全能统筹型" 硬件,擅长复杂逻辑判断、串行任务处理(如系统调度、软件运行),核心数量通常在 4-64 核;而 GPU 是 "并行计算专家",专注于海量、重复数据的并行处理(如同时计算数百万像素颜色、批量处理 AI 训练数据),核心数可多达数千甚至数万(如 NVIDIA H100 拥有 16384 个 CUDA 核心),形象来说,CPU 像公司 CEO 负责全局决策,GPU 则像工厂流水线工人,高效完成标准化批量任务。
在架构上
GPU 的并行能力源于 "大量轻量级计算核心 + 高带宽显存" 的组合。核心组成包括计算核心(执行具体并行计算,如 NVIDIA 的 CUDA 核心、AMD 的流处理器)、显存(VRAM,存储待处理数据,避免频繁读取内存,关键指标有容量 8GB/12GB/24GB 等、带宽 500GB/s + 等)、显存控制器(管理数据传输,位宽 128bit/256bit/512bit 等,位宽越高通常带宽越大),以及专用加速单元(如光线追踪单元提升实时光影效果、AI 加速单元优化 AI 运算)。
按用途划分
GPU 主要分为消费级和专业级两类。消费级 GPU 面向个人用户,核心用于游戏娱乐(渲染 3D 画面、计算光影粒子效果)、日常图形处理(视频剪辑、图片修图)、轻度 AI 计算(本地运行小型 AI 模型),代表产品有 NVIDIA GeForce 系列(如 RTX 4060/4070/4090,支持光追、DLSS 技术提升帧率)、AMD Radeon 系列(如 RX 7600/7700 XT,性价比高,支持 FSR 技术,对 Linux 兼容性较好),选择时需关注游戏帧率、显存容量(1080P 游戏需 8GB 以上,4K 游戏需 12GB 以上)、光追性能。专业级 GPU 则面向企业与行业用户,细分场景包括专业图形设计(3D 建模、影视渲染,代表产品如 NVIDIA Quadro 系列 RTX A5500、AMD Radeon Pro 系列 Pro V620,优化专业软件兼容性)、AI 加速与数据中心计算(如 NVIDIA H100/A100、AMD Instinct MI300,高算力、高显存带宽,支持多卡互联)、嵌入式场景(如 NVIDIA Jetson 系列 AGX Orin,体积小、功耗低,用于自动驾驶、机器人),选择时侧重软件兼容性、算力(FP32/FP16/FP8 精度)、显存带宽等。
应用场景上
GPU 已突破图形领域限制。游戏娱乐中,它实时渲染 3D 画面,计算光影、粒子效果,借助 DLSS/FSR 技术提升高分辨率帧率;内容创作里,加速视频剪辑(如 Premiere Pro)、3D 渲染(如 Blender)、动画制作,缩短导出时间;人工智能领域,训练阶段并行处理海量数据更新模型参数(如 ChatGPT 训练依赖数千块 GPU),推理阶段快速响应 AI 请求(如 AI 绘图、语音识别);科学计算方面,模拟气象、分子动力学(药物研发)、天体物理,降低算力成本;数据中心中,加速数据库查询、云计算、加密解密,提升处理效率。
主流厂商方面,市场呈 "双寡头主导 + 新兴玩家追赶" 格局。NVIDIA(英伟达)市场份额最高(消费级 + 数据中心级超 80%),拥有成熟 CUDA 生态(支持多数 AI 框架、专业软件),AI 加速技术领先,但价格偏高,部分专业卡有功能限制;AMD(超威)性价比高,支持 OpenCL/Vulkan 等开源框架(适配 Linux、开源 AI 项目),部分显卡支持显存扩展,不过生态成熟度略逊于 NVIDIA;新兴玩家中,英特尔 Arc 系列主打中端消费市场,国产厂商如华为昇腾、壁仞科技,聚焦国内 AI 与数据中心市场,适配国产化软件和芯片。
二.虚拟机安装显卡驱动文字介绍
虚拟机安装显卡驱动,核心需先区分 "使用虚拟显卡" 和 "使用物理显卡(PCI 直通)" 两种场景,二者操作逻辑和适用需求差异较大,具体流程如下:
核心场景区分
- 虚拟显卡驱动:由 VMware、VirtualBox 等虚拟机软件模拟生成(如 VMware SVGA II、VirtualBox VGA),仅需安装虚拟机自带的 "增强工具" 即可适配,操作简单,适合日常办公、简单图形界面显示(无 GPU 加速需求),驱动来源为虚拟机工具(如 VMware Tools、VirtualBox Guest Additions)。
- 物理显卡驱动:需先将宿主机的 NVIDIA/AMD 物理显卡通过 "PCI 直通" 技术分配给虚拟机,再安装显卡厂商官方驱动,步骤复杂但能发挥显卡真实性能,适合游戏、AI 计算、3D 渲染等需 GPU 性能的场景,驱动来源为显卡厂商官网(如 NVIDIA 官网、AMD 官网)。
虚拟显卡驱动安装(以主流虚拟机为例)
1. VMware Workstation(以 Windows 虚拟机为例)
- 启动 Windows 虚拟机并进入桌面,点击 VMware 顶部菜单栏 "虚拟机",选择 "安装 VMware Tools"(若已安装则显示 "重新安装 VMware Tools");
- 虚拟机内会自动加载 VMware Tools 安装镜像,打开光盘驱动器,双击 "setup.exe",按安装向导默认步骤完成安装,最后重启虚拟机;
- 重启后,右键点击 "此电脑"→"管理"→"设备管理器"→"显示适配器",若显示 "VMware SVGA 3D Adapter"(或类似名称)且无黄色感叹号,说明驱动安装成功。
2. VirtualBox(以 Linux 虚拟机为例)
- 启动 Linux 虚拟机(如 Ubuntu)并进入桌面,点击 VirtualBox 顶部菜单栏 "设备",选择 "安装增强功能";
- 若系统提示挂载镜像,点击 "是",然后打开终端,执行命令 "sudo mount /dev/cdrom/media/cdrom" 挂载镜像,再进入挂载目录(cd /media/cdrom),执行 "sudo ./VBoxLinuxAdditions.run" 运行安装脚本;
- 若安装过程中提示缺少依赖(如 gcc、make),按提示执行 "sudo apt install gcc make linux-headers-$(uname -r)" 安装依赖,完成后重启虚拟机;
- 重启后,执行 "lspci | grep -i vga",若显示 "VirtualBox Graphics Adapter" 且桌面分辨率可正常调整,说明驱动生效。
物理显卡驱动安装(需 PCI 直通,以 NVIDIA 显卡 + VMware Workstation+Linux 虚拟机为例)
1. 前置条件(关键,直通失败多因条件不满足)
- 宿主机硬件:CPU 需支持虚拟化技术(Intel VT-d/AMD Vi),主板支持 PCIe 直通,且配备支持 "GPU 直通" 的独立 NVIDIA 显卡(多数消费级、专业级显卡均支持);
- 宿主机 BIOS 配置:重启宿主机,进入 BIOS(华硕按 Del、戴尔按 F2 等),找到 "Intel VT-d"(Intel CPU)或 "AMD Vi"(AMD CPU),设置为 "Enabled",保存后重启;
- 虚拟机软件:需使用支持 PCI 直通的版本(如 VMware Workstation Pro 16+、VMware ESXi,免费版 VMware Player 不支持)。
2. 配置 VMware 显卡直通
- 确保目标虚拟机处于 "关机" 状态,打开 VMware Workstation,右键点击该虚拟机→"设置"→"添加";
- 在 "添加硬件向导" 中选择 "PCI 设备",点击 "下一步",在 "可用 PCI 设备" 列表中勾选宿主机的 NVIDIA 显卡(如 "NVIDIA GeForce RTX 4070"),勾选 "为此设备启用 PCIe 直通",点击 "完成" 并保存配置。
3. 安装物理显卡驱动
- 启动虚拟机,执行 "lspci | grep -i nvidia",若显示 NVIDIA 显卡型号(如 "NVIDIA Corporation RTX 4070"),说明显卡已成功直通;
- 从 NVIDIA 官网下载对应显卡型号、对应虚拟机系统(如 Linux x86_64)的驱动安装包(.run 格式);
- 打开终端,赋予安装包执行权限(sudo chmod +x 驱动文件名.run),然后执行安装命令(sudo ./ 驱动文件名.run),按提示完成安装(期间需关闭图形界面,按向导提示操作即可);
- 安装完成后重启虚拟机,执行 "nvidia-smi"(NVIDIA 专用命令),若显示显卡型号、驱动版本、显存信息,说明物理显卡驱动安装成功。
常见问题
- 虚拟显卡驱动安装后分辨率异常:多为增强工具未正确安装,可卸载后重新安装,或检查虚拟机设置中 "显示" 的 "显存大小" 是否设置过低(建议设为 256MB 及以上);
- 物理显卡直通失败:需重新检查宿主机 BIOS 中 VT-d/AMD Vi 是否开启,虚拟机是否关机状态配置直通,或显卡是否支持直通(部分早期低端显卡可能不支持);
- NVIDIA 驱动安装提示 "未找到兼容显卡":需确认显卡已成功直通到虚拟机,或驱动版本与显卡型号、系统版本不匹配,重新从官网下载对应版本驱动。
三、CentOS7与Ubuntu18安装显卡指导
1.安装系统(centos)
选择工作站版本并安装developmenttools工具包(必须项目)
2.安装必要依赖包(centos)
yum install gcc gcc-c++ make -y
3.禁用开源显卡驱动(centos)
echo "blacklist nouveau" >>/etc/modprobe.d/blacklist.conf
dracut /boot/initramfs-$(uname -r).img $(uname -r) --force
4.重启并安装驱动(通用)
init 3 #重启后进入图形安装
sh NVIDIA-Linux-x86_64-440.100.run -no-opengl-files #开始安装
注意:
-no-opengl-files
-no-opengl-files 只安装驱动文件,不安装OpenGL文件,这个参数最重要,如果不需要从显卡输出视频必须加此参数,否则黑屏(例如tesela诶vga显示系列)
-no-x-check 安装驱动时不检查X服务
-no-nouveau-check安装驱动时不检查nouveau


安装截图

Ubuntu 安装驱动类似,以下为特别注意不同点
1.安装依赖
apt-get install make gcc g++ -y
2.禁用开源驱动
echo "blacklist nouveau" >>/etc/modprobe.d/blacklist.conf
update-initramfs -u && init 6 #更新内核并重启
#安装驱动参考CentOS
5.安装cuda(后面内容为centos与ubuntu通用)
sh cuda_10.0.130_410.48_linux.run
安装中

安装成功

6.跑显卡压力测试查看显卡
mkdir test && cd test/
wget http://wili.cc/blog/entries/gpu-burn-0.9.tar.gz
tar -zxvf gpu_burn-0.9.tar.gz
export PATH=$PATH:/usr/local/cuda-10.0/bin
make
./gup_burn 600 #执行 测试600s
nvidia-smi -l #查看显卡状态
7.cpu压力测试
上传脚本位置
sh cpu_benchmark.sh #开始测试关机停止
#以下为脚本内容无需关心
#!/bin/bash
killall cat #kill test_proces
rm -rf log #remove cmd file
ncpus='lscpu | grep "CUP(s):" | grep -v "NUMA" | awk'{print $2}''
CMD=" nohup cat /dec/urandom | md5sum & "
for i in 'seq 1 ${ncpus};do echo $CMD >>log ; done
sh log
#cat /dev/urandom | md5sum
top #查看cpu负载
其他相关指令
nvcc -V #查看cuda版本
rpm -qa | grep -i cuda #检查是否通过yum或者rpm包安装cuda,无输出则为.run安装
ls /usr/local | grep cuda #检查是否为.run包安装
需根据安装方式卸载cuda
conda env list #查看conda环境
conda create -n ssssss python=3.9 #新建conda虚拟环境