技术栈
明明已经把vllm被强制kill了,但是仍然占用GPU显存
hit56实验室
2026-02-25 10:46
强制杀掉所有包含 vllm 关键字的进程
pkill -9 -f vllm
如果 vllm 启用了 ray,清理残留的 ray worker
pkill -9 -f ray
或者更直接一点,清理当前用户下的挂起 python 进程(谨慎使用,确保没杀错)
pkill -9 -f python
vllm
上一篇:
【MySQL】4. MySQL表的操作
下一篇:
CCF-CSP 33-2 相似度计算(jaccard)【C++】考点:STL容器(set/map)
相关推荐
毒爪的小新
1 天前
Linux 环境极速部署 vLLM:从零搭建生产级大模型推理服务
linux
·
人工智能
·
ai
·
语言模型
·
vllm
像风一样自由2020
1 天前
17.推理框架横评:vLLM / TGI / TensorRT-LLM / SGLang 全面对比
人工智能
·
大模型
·
vllm
·
sglang
rebibabo
2 天前
KV Cache 与 PagedAttention 详解:理论推导 + RTX 3090 实测数据
人工智能
·
vllm
·
推理加速
·
大模型部署
·
kvcache
随便做点啥
3 天前
8×910B4-32G NPU服务器 vLLM-Ascend部署Docker安装报告
服务器
·
docker
·
vllm
大模型推理
3 天前
《Nano-vLLM 源码解读》第 18 篇 · Embedding 与 LM Head
embedding
·
vllm
hdsoft_huge
4 天前
部署 Nacos + Ollama + vLLM + MCP 完整图文教程(1Panel 面板,命令行安装两种方式)
python
·
vllm
·
ollama
·
mcp
我是谁??
4 天前
ubuntu22.04 通过docker部署vLLM(Qwen3-0.6B)大模型+New API+OpenWebUI
docker
·
容器
·
vllm
lipku
5 天前
LiveTalking 更新:集成 vLLM-Omni TTS服务
python
·
开源
·
数字人
·
vllm
·
实时数字人
嘉陵妹妹
5 天前
vLLM 源码可编辑模式安装与调试记录
vllm
热门推荐
01
HTTP 与 HTTPS 的区别:从原理到实战详解
02
2026年6月AI行业全景:从百模大战到Agent元年,这30天发生了什么?
03
2026 AI 编程工具终极实战指南:Cursor vs Claude Code vs Copilot,开发者该怎么选?
04
【AI】2026 年具身智能模型和世界模型总结
05
GitHub 镜像站点
06
2026 年 AI 编程工具终极横评:Cursor vs Claude Code vs Copilot vs Windsurf
07
AI科技热点日报 | 2026年6月1日
08
Claude Code、Codex、Cursor三分天下:2026年AI编程Agent生态全景剖析
09
《置身钉内》原文-可播放阅读
10
上线仅72小时被强制下架:Claude Fable 5 的短命