ubuntu设置GPU功率

前言

上次发了一篇文章,我使用脚本自动根据GPU温度调整服务器风扇转速

但是我实测之后,发现这个方法还是压不住我GPU的温度,暂时不清楚什么原因

所以我准备把GPU功耗压低

先看看gpu的功耗限制

bash 复制代码
nvidia-smi -q -d POWER

使用上面的命令会输出gpu的功耗的信息,如果出现找不到命令的情况先安装gpu驱动

bash 复制代码
chen@chen:~$ nvidia-smi -q -d POWER

==============NVSMI LOG==============

Timestamp                                 : Tue Jun 11 10:20:46 2024
Driver Version                            : 470.42.01
CUDA Version                              : 11.4

Attached GPUs                             : 2
GPU 00000000:01:00.0
    Power Readings
        Power Management                  : Supported
        Power Draw                        : 28.20 W
        Power Limit                       : 100.00 W
        Default Power Limit               : 149.00 W
        Enforced Power Limit              : 100.00 W
        Min Power Limit                   : 100.00 W
        Max Power Limit                   : 175.00 W
    Power Samples
        Duration                          : 119.17 sec
        Number of Samples                 : 119
        Max                               : 28.20 W
        Min                               : 27.97 W
        Avg                               : 28.16 W

GPU 00000000:02:00.0
    Power Readings
        Power Management                  : Supported
        Power Draw                        : 30.32 W
        Power Limit                       : 100.00 W
        Default Power Limit               : 149.00 W
        Enforced Power Limit              : 100.00 W
        Min Power Limit                   : 100.00 W
        Max Power Limit                   : 175.00 W
    Power Samples
        Duration                          : 119.16 sec
        Number of Samples                 : 119
        Max                               : 30.32 W
        Min                               : 30.08 W
        Avg                               : 30.23 W

来看看这张显卡的最低和最高功率限制多少

bash 复制代码
        Min Power Limit                   : 100.00 W
        Max Power Limit                   : 175.00 W

我这张卡是两个核心的,所以会显示 GPU 00000000:01:00.0 和GPU 00000000:02:00.0

可以看到单个核心最低功率是100W,最高功率的175W

调整功率

bash 复制代码
sudo nvidia-smi -pl 100

给两个核心都限制100W

bash 复制代码
chen@chen:~$ sudo nvidia-smi -pl 100
Power limit for GPU 00000000:01:00.0 was set to 100.00 W from 100.00 W.
Power limit for GPU 00000000:02:00.0 was set to 100.00 W from 100.00 W.
All done.

从输出来看,两个核心都已经调整为了100W功率

相关推荐
骑上单车去旅行8 小时前
openEuler 22.03 离线源码编译 Zabbix 7.0.27 完整最终整合手册
linux·运维·服务器·zabbix
AC赳赳老秦9 小时前
OpenClaw + 云数据库运维:自动备份、扩容、迁移 RDS/MySQL 云数据库
运维·开发语言·数据库·人工智能·python·mysql·openclaw
向日葵.9 小时前
linux & qnx & git 命令 1
linux·运维·服务器
MXsoft6189 小时前
**非Agent部署:网络设备分钟级纳管的技术解析**
运维·自动化
艾德金的溪9 小时前
windows安装CC Switch
运维·ai
2023自学中9 小时前
Linux 内核与用户空间 内存管理详解(堆与栈篇)
linux·嵌入式·内存·开发板
极客先躯9 小时前
高级java每日一道面试题-2026年02月09日-实战篇[Docker]-Docker 容器有哪些安全风险?如何缓解?
java·运维·网络·安全·docker·容器
yuanzhengme9 小时前
Ollama【部署 07】搭建本地智能体的简单说明(局域网离线部署Ollama+模型迁移+Docker部署AnythingLLM)
运维·docker·容器·大模型·ollama·本地智能体
似水এ᭄往昔9 小时前
【Linux系统编程】--虚拟地址空间
linux·服务器
不会C语言的男孩9 小时前
Linux 系统编程 · 第 3 章:文件 I/O 基础
linux·服务器