Ubuntu 24.04 从源码编译 dcgm-exporter
- [第一步:添加 NVIDIA CUDA 仓库](#第一步:添加 NVIDIA CUDA 仓库)
- 第二步:更新包列表
- [第三步:搜索 DCGM 包](#第三步:搜索 DCGM 包)
- [第四步:安装 DCGM](#第四步:安装 DCGM)
- 第五步:启用服务
- 第六步:验证安装
- [从源码编译 dcgm-exporter](#从源码编译 dcgm-exporter)
- 参考
第一步:添加 NVIDIA CUDA 仓库
shell
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
rm cuda-keyring_1.1-1_all.deb
第二步:更新包列表
shell
sudo apt-get update
第三步:搜索 DCGM 包
shell
apt-cache search datacenter-gpu-manager
第四步:安装 DCGM
shell
sudo apt-get install --yes --install-recommends datacenter-gpu-manager-4-cuda12
第五步:启用服务
shell
sudo systemctl --now enable nvidia-dcgm
第六步:验证安装
shell
dcgmi discovery -l
shell
cd dcgm-exporter
make binary
sudo make install
dcgm-exporter &
curl localhost:9400/metrics
从源码编译 dcgm-exporter
已安装 Golang 1.24 或更高版本
DCGM 已安装
javascript
git clone https://github.com/NVIDIA/dcgm-exporter.git
cd dcgm-exporter
make binary
sudo make install
dcgm-exporter &
curl localhost:9400/metrics