简单而管用的清理gpu显存的方法及分析

bash 复制代码
sudo fuser -v /dev/nvidia2 | awk '{for(i=1;i<=NF;i++)print "kill -9 " $i;}' | sudo sh

首先直接提高管用的一段命令,注意应当将nvidia2替换为想要清除的gpu id。

在工程实践中,经常会遇到这样的困境即gpu的全部或者部分显存在上次运行城西未能正常exit后被占用导致后续运行程序无法使用相应的gpu。

解决办法为这行代码,下面是分析:

按照bash命令的规则,这行命令可以分为三个部分,用pipeline的形式把上一步返回的内容交给下一步。

首先是命令:

bash 复制代码
sudo fuser -v /dev/nvidia2

fuser是用于执行进程查找的工具,/dev/nvidia2指向了gpu设备cuda:2这段命令执行后返回了所有正在使用 /dev/nvidia2这个GPU的进程的PID。

其次是命令:

bash 复制代码
awk '{for(i=1;i<=NF;i++)print "kill -9 " $i;}'

awk是一个强大的文本处理和数据提取工具。它非常擅长处理按行和列(字段)结构化的文本。后面就是将上一步返回的PID值遍历打印为kill -9 PID(即杀死进程)。

后面的

bash 复制代码
sudo sh

则是执行所有的返回的打印杀死进程的命令,执行​ ​上一步生成的所有 kill -9命令。sh会读取它接收到的每一行文本(即 kill -9 1234kill -9 5678),并将其作为命令来执行。

相关推荐
开开心心就好2 天前
免费无广告卸载工具,轻便安全适配全用户
linux·运维·服务器·网络·安全·启发式算法·1024程序员节
开开心心就好3 天前
图片格式转换工具,右键菜单一键转换简化
linux·运维·服务器·python·django·pdf·1024程序员节
徐子童5 天前
网络协议---TCP协议
网络·网络协议·tcp/ip·面试题·1024程序员节
扫地的小何尚6 天前
NVIDIA RTX PC开源AI工具升级:加速LLM和扩散模型的性能革命
人工智能·python·算法·开源·nvidia·1024程序员节
数据皮皮侠AI7 天前
上市公司股票名称相似度(1990-2025)
大数据·人工智能·笔记·区块链·能源·1024程序员节
开开心心就好8 天前
系统清理工具清理缓存日志,启动卸载管理
linux·运维·服务器·神经网络·cnn·pdf·1024程序员节
Evan东少10 天前
[踩坑]笔记本Ubuntu20.04+NvidiaRTX5060驱动+cuda+Pytorch+ROS/Python实现人脸追踪(环境准备)
1024程序员节
不爱编程的小陈12 天前
C/C++每日面试题
面试·职场和发展·1024程序员节
开开心心就好12 天前
右键菜单管理工具,添加程序自定义名称位置
linux·运维·服务器·ci/cd·docker·pdf·1024程序员节
码农三叔13 天前
(4-2-05)Python SDK仓库:MCP服务器端(5)Streamable HTTP传输+Streamable HTTP传输
开发语言·python·http·大模型·1024程序员节·mcp·mcp sdk