前言
上次发了一篇文章,我使用脚本自动根据GPU温度调整服务器风扇转速
但是我实测之后,发现这个方法还是压不住我GPU的温度,暂时不清楚什么原因
所以我准备把GPU功耗压低
先看看gpu的功耗限制
bash
nvidia-smi -q -d POWER
使用上面的命令会输出gpu的功耗的信息,如果出现找不到命令的情况先安装gpu驱动
bash
chen@chen:~$ nvidia-smi -q -d POWER
==============NVSMI LOG==============
Timestamp : Tue Jun 11 10:20:46 2024
Driver Version : 470.42.01
CUDA Version : 11.4
Attached GPUs : 2
GPU 00000000:01:00.0
Power Readings
Power Management : Supported
Power Draw : 28.20 W
Power Limit : 100.00 W
Default Power Limit : 149.00 W
Enforced Power Limit : 100.00 W
Min Power Limit : 100.00 W
Max Power Limit : 175.00 W
Power Samples
Duration : 119.17 sec
Number of Samples : 119
Max : 28.20 W
Min : 27.97 W
Avg : 28.16 W
GPU 00000000:02:00.0
Power Readings
Power Management : Supported
Power Draw : 30.32 W
Power Limit : 100.00 W
Default Power Limit : 149.00 W
Enforced Power Limit : 100.00 W
Min Power Limit : 100.00 W
Max Power Limit : 175.00 W
Power Samples
Duration : 119.16 sec
Number of Samples : 119
Max : 30.32 W
Min : 30.08 W
Avg : 30.23 W
来看看这张显卡的最低和最高功率限制多少
bash
Min Power Limit : 100.00 W
Max Power Limit : 175.00 W
我这张卡是两个核心的,所以会显示 GPU 00000000:01:00.0 和GPU 00000000:02:00.0
可以看到单个核心最低功率是100W,最高功率的175W
调整功率
bash
sudo nvidia-smi -pl 100
给两个核心都限制100W
bash
chen@chen:~$ sudo nvidia-smi -pl 100
Power limit for GPU 00000000:01:00.0 was set to 100.00 W from 100.00 W.
Power limit for GPU 00000000:02:00.0 was set to 100.00 W from 100.00 W.
All done.
从输出来看,两个核心都已经调整为了100W功率