ubuntu设置GPU功率

前言

上次发了一篇文章,我使用脚本自动根据GPU温度调整服务器风扇转速

但是我实测之后,发现这个方法还是压不住我GPU的温度,暂时不清楚什么原因

所以我准备把GPU功耗压低

先看看gpu的功耗限制

bash 复制代码
nvidia-smi -q -d POWER

使用上面的命令会输出gpu的功耗的信息,如果出现找不到命令的情况先安装gpu驱动

bash 复制代码
chen@chen:~$ nvidia-smi -q -d POWER

==============NVSMI LOG==============

Timestamp                                 : Tue Jun 11 10:20:46 2024
Driver Version                            : 470.42.01
CUDA Version                              : 11.4

Attached GPUs                             : 2
GPU 00000000:01:00.0
    Power Readings
        Power Management                  : Supported
        Power Draw                        : 28.20 W
        Power Limit                       : 100.00 W
        Default Power Limit               : 149.00 W
        Enforced Power Limit              : 100.00 W
        Min Power Limit                   : 100.00 W
        Max Power Limit                   : 175.00 W
    Power Samples
        Duration                          : 119.17 sec
        Number of Samples                 : 119
        Max                               : 28.20 W
        Min                               : 27.97 W
        Avg                               : 28.16 W

GPU 00000000:02:00.0
    Power Readings
        Power Management                  : Supported
        Power Draw                        : 30.32 W
        Power Limit                       : 100.00 W
        Default Power Limit               : 149.00 W
        Enforced Power Limit              : 100.00 W
        Min Power Limit                   : 100.00 W
        Max Power Limit                   : 175.00 W
    Power Samples
        Duration                          : 119.16 sec
        Number of Samples                 : 119
        Max                               : 30.32 W
        Min                               : 30.08 W
        Avg                               : 30.23 W

来看看这张显卡的最低和最高功率限制多少

bash 复制代码
        Min Power Limit                   : 100.00 W
        Max Power Limit                   : 175.00 W

我这张卡是两个核心的,所以会显示 GPU 00000000:01:00.0 和GPU 00000000:02:00.0

可以看到单个核心最低功率是100W,最高功率的175W

调整功率

bash 复制代码
sudo nvidia-smi -pl 100

给两个核心都限制100W

bash 复制代码
chen@chen:~$ sudo nvidia-smi -pl 100
Power limit for GPU 00000000:01:00.0 was set to 100.00 W from 100.00 W.
Power limit for GPU 00000000:02:00.0 was set to 100.00 W from 100.00 W.
All done.

从输出来看,两个核心都已经调整为了100W功率

相关推荐
szxinmai主板定制专家2 分钟前
电力设备RK3568/RK3576+FPGA,多系统混合部署Linux+RTOS RT-THREAD,强实时性
linux·运维·服务器·人工智能·嵌入式硬件·fpga开发
枕星而眠12 分钟前
Linux 四大进程/线程同步锁详解:互斥锁、读写锁、条件变量、文件锁
linux·c语言·后端·ubuntu·学习方法
我是坑货41 分钟前
Jenkins 构建失败排查记录:mvn -U 把新版依赖被远程旧版覆盖
运维·jenkins
L、21844 分钟前
CANN调优工具链全景:从profiler到tensorboard的完整观测体系
linux·运维·服务器·深度学习
码点滴1 小时前
Workload 自动化进化论:从手动运维到 AI 驱动的 Kubernetes 智能管控
运维·人工智能·kubernetes·自动化·workload
darkdragonking1 小时前
Docker(五)OpenEuler22.03 安装docker ce、排坑
运维·docker·容器
j_xxx404_1 小时前
Linux进程信号捕捉与操作系统运行本质深度解析
linux·运维·服务器·开发语言·c++·人工智能·ai
eggrall1 小时前
Linux信号——保存信号
linux·运维·服务器
2501_920047031 小时前
firewalld的使用
linux·运维
z202305082 小时前
以太网之VLAN介绍
linux·服务器·网络·人工智能·ai