技术栈
明明已经把vllm被强制kill了,但是仍然占用GPU显存
hit56实验室
2026-02-25 10:46
强制杀掉所有包含 vllm 关键字的进程
pkill -9 -f vllm
如果 vllm 启用了 ray,清理残留的 ray worker
pkill -9 -f ray
或者更直接一点,清理当前用户下的挂起 python 进程(谨慎使用,确保没杀错)
pkill -9 -f python
vllm
上一篇:
【MySQL】4. MySQL表的操作
下一篇:
CCF-CSP 33-2 相似度计算(jaccard)【C++】考点:STL容器(set/map)
相关推荐
陈 洪 伟
1 天前
大模型推理引擎vLLM(14): 什么是MLA多头潜在注意力
vllm
·
mla
陈 洪 伟
2 天前
大模型推理引擎vLLM(12): vLLM Prefix Caching以及eviction的相关问题和代码
vllm
·
prefix caching
深刻如此
2 天前
Qwen2.5-7B-Instruct实战教程:Chainlit集成WebSocket实时通信增强
大语言模型
·
文本生成
·
vllm
·
chainlit
长路 ㅤ
3 天前
快速了解VLLM推理引擎
模型部署
·
vllm
·
xinference
·
推理引擎
·
ai框架
陈 洪 伟
3 天前
大模型推理引擎vLLM(9): vLLM 基本代码结构
vllm
SmartBrain
3 天前
技术总结:VLLM部署Qwen3模型的详解
开发语言
·
人工智能
·
算法
·
vllm
陈 洪 伟
3 天前
大模型推理引擎vLLM(10): vLLM 分布式推理源码结构解析
分布式
·
vllm
鱼总美签
5 天前
ClawdBot保姆级教学:解决Gateway not reachable错误的5种方法
ai助手
·
vllm
·
本地大模型
·
clawdbot
Suryxin.
7 天前
从0开始复现nano-vllm「llm_engine.py」
人工智能
·
python
·
深度学习
·
ai
·
vllm
热门推荐
01
GitHub 镜像站点
02
Claude Code + GLM4.7 避坑指南:解决 Unable to connect to Anthropic services
03
AI Agent 平台横评:ZeroClaw vs OpenClaw vs Nanobot
04
【OpenClaw 本地实战 Ep.3】突破瓶颈:强制修改 openclaw.json 解锁 32k 上下文记忆
05
Clawdbot部署教程:解决‘gateway token missing’授权问题的完整步骤
06
OpenClaw 安装之(三)DeepSeek模型接入配置和详细配置参数
07
AI agent:介绍 ZeroClaw 安装,使用
08
OpenClaw 使用和管理 MCP 完全指南
09
AI 规范驱动开发“三剑客”深度对比:Spec-Kit、Kiro 与 OpenSpec 实战指南
10
配置 OpenClaw 使用 Ollama 本地模型