ubuntu设置GPU功率

前言

上次发了一篇文章,我使用脚本自动根据GPU温度调整服务器风扇转速

但是我实测之后,发现这个方法还是压不住我GPU的温度,暂时不清楚什么原因

所以我准备把GPU功耗压低

先看看gpu的功耗限制

bash 复制代码
nvidia-smi -q -d POWER

使用上面的命令会输出gpu的功耗的信息,如果出现找不到命令的情况先安装gpu驱动

bash 复制代码
chen@chen:~$ nvidia-smi -q -d POWER

==============NVSMI LOG==============

Timestamp                                 : Tue Jun 11 10:20:46 2024
Driver Version                            : 470.42.01
CUDA Version                              : 11.4

Attached GPUs                             : 2
GPU 00000000:01:00.0
    Power Readings
        Power Management                  : Supported
        Power Draw                        : 28.20 W
        Power Limit                       : 100.00 W
        Default Power Limit               : 149.00 W
        Enforced Power Limit              : 100.00 W
        Min Power Limit                   : 100.00 W
        Max Power Limit                   : 175.00 W
    Power Samples
        Duration                          : 119.17 sec
        Number of Samples                 : 119
        Max                               : 28.20 W
        Min                               : 27.97 W
        Avg                               : 28.16 W

GPU 00000000:02:00.0
    Power Readings
        Power Management                  : Supported
        Power Draw                        : 30.32 W
        Power Limit                       : 100.00 W
        Default Power Limit               : 149.00 W
        Enforced Power Limit              : 100.00 W
        Min Power Limit                   : 100.00 W
        Max Power Limit                   : 175.00 W
    Power Samples
        Duration                          : 119.16 sec
        Number of Samples                 : 119
        Max                               : 30.32 W
        Min                               : 30.08 W
        Avg                               : 30.23 W

来看看这张显卡的最低和最高功率限制多少

bash 复制代码
        Min Power Limit                   : 100.00 W
        Max Power Limit                   : 175.00 W

我这张卡是两个核心的,所以会显示 GPU 00000000:01:00.0 和GPU 00000000:02:00.0

可以看到单个核心最低功率是100W,最高功率的175W

调整功率

bash 复制代码
sudo nvidia-smi -pl 100

给两个核心都限制100W

bash 复制代码
chen@chen:~$ sudo nvidia-smi -pl 100
Power limit for GPU 00000000:01:00.0 was set to 100.00 W from 100.00 W.
Power limit for GPU 00000000:02:00.0 was set to 100.00 W from 100.00 W.
All done.

从输出来看,两个核心都已经调整为了100W功率

相关推荐
阿里云大数据AI技术1 天前
阿里云 EMR AI 助手正式发布:从问答工具到全栈智能运维助手
运维·人工智能
orion572 天前
Missing Semester Class1:course overview and introduction of shell
linux
SkyWalking中文站2 天前
认识 Horizon UI · 6/17:Trace 探索器
运维·监控·自动化运维
用户120487221612 天前
Linux驱动编译与加载
linux·嵌入式
火车叼位2 天前
写给初级开发者:SSL、SSH、HTTPS 与证书体系全解析
运维
用户805533698033 天前
Input 子系统架构:Core、Handler、Driver 三层是怎么协作的
linux·嵌入式
用户805533698033 天前
RK-Forge外设系列开篇 - 把板子从「能启动」变成「能用」:Ethernet/SPI/MMC 三个纯接线外设
linux·github·嵌入式
小猿姐3 天前
唯品会大规模数据库云原生实践:基于 KubeBlocks 管理数千实例的统一运维之路
运维·elasticsearch·云原生
七歌杜金房3 天前
我终于又有了自己的 Linux 电脑
linux·debian·mac
SkyWalking中文站3 天前
认识 Horizon UI · 5/17:3D 基础设施地图
运维·监控·自动化运维