简单而管用的清理gpu显存的方法及分析

bash 复制代码
sudo fuser -v /dev/nvidia2 | awk '{for(i=1;i<=NF;i++)print "kill -9 " $i;}' | sudo sh

首先直接提高管用的一段命令,注意应当将nvidia2替换为想要清除的gpu id。

在工程实践中,经常会遇到这样的困境即gpu的全部或者部分显存在上次运行城西未能正常exit后被占用导致后续运行程序无法使用相应的gpu。

解决办法为这行代码,下面是分析:

按照bash命令的规则,这行命令可以分为三个部分,用pipeline的形式把上一步返回的内容交给下一步。

首先是命令:

bash 复制代码
sudo fuser -v /dev/nvidia2

fuser是用于执行进程查找的工具,/dev/nvidia2指向了gpu设备cuda:2这段命令执行后返回了所有正在使用 /dev/nvidia2这个GPU的进程的PID。

其次是命令:

bash 复制代码
awk '{for(i=1;i<=NF;i++)print "kill -9 " $i;}'

awk是一个强大的文本处理和数据提取工具。它非常擅长处理按行和列(字段)结构化的文本。后面就是将上一步返回的PID值遍历打印为kill -9 PID(即杀死进程)。

后面的

bash 复制代码
sudo sh

则是执行所有的返回的打印杀死进程的命令,执行​ ​上一步生成的所有 kill -9命令。sh会读取它接收到的每一行文本(即 kill -9 1234kill -9 5678),并将其作为命令来执行。

相关推荐
新猿一马12 小时前
kafka组件traceId增强
1024程序员节
FinTech老王12 小时前
国产数据库替代MongoDB:政务电子证照新选择
mongodb·1024程序员节
Q741_14712 小时前
C++ 分治 快速选择算法 堆排序 TopK问题 力扣 215. 数组中的第K个最大元素 题解 每日一题
c++·算法·leetcode·分治·1024程序员节·topk问题·快速选择算法
金仓拾光集12 小时前
政务系统信创改造中,金仓日志如何满足等保2.0三级审计要求
1024程序员节
综合热讯12 小时前
WPS 365政务版亮相2025数博会,AI生成公文可用度达90%
1024程序员节
云边有个稻草人12 小时前
KingbaseES:MongoDB 国产化平替的优选方案,从技术适配到政务落地
1024程序员节·金仓数据库
兢兢业业的小白鼠12 小时前
Java常用中间件整理讲解——Redis,RabbitMQ
java·中间件·java-rabbitmq·1024程序员节
China渔火12 小时前
CDC 实时数据同步与小时级统计方案(Flink 1.13.5 + MySQL 8.0)
1024程序员节