技术栈
明明已经把vllm被强制kill了,但是仍然占用GPU显存
hit56实验室
2026-02-25 10:46
强制杀掉所有包含 vllm 关键字的进程
pkill -9 -f vllm
如果 vllm 启用了 ray,清理残留的 ray worker
pkill -9 -f ray
或者更直接一点,清理当前用户下的挂起 python 进程(谨慎使用,确保没杀错)
pkill -9 -f python
vllm
上一篇:
【MySQL】4. MySQL表的操作
下一篇:
CCF-CSP 33-2 相似度计算(jaccard)【C++】考点:STL容器(set/map)
相关推荐
花间相见
8 小时前
【大模型推理01】—— 初探VLLM:高性能LLM推理引擎,让开源模型跑起来更快更省
开源
·
vllm
Flying pigs~~
18 小时前
大模型训练框架 ➕ 推理部署框架
模型训练
·
deepspeed
·
vllm
·
模型推理
·
zero
·
pageattention
AI木马人
1 天前
2.人工智能实战:大模型接口并发低、GPU利用率上不去?基于 vLLM 重构推理服务的完整工程方案
人工智能
·
transformer
·
vllm
AIDF2026
4 天前
我们看一份报告的时候主要看什么
运维
·
服务器
·
推理
·
vllm
张忠琳
4 天前
【vllm】(八)vLLM v1 Simple KV Offload — 系统级架构深度分析之二
ai
·
架构
·
vllm
一只独角兽
5 天前
DeepSeek-V4-Pro 部署实战指南:H100/H200/B200/B300/GB200/GB300 全硬件配置详解
自然语言处理
·
gru
·
transformer
·
vllm
张忠琳
5 天前
【vllm】(六)vLLM v1 Sample — 模块超深度分析之一
ai
·
架构
·
vllm
蛐蛐蛐
5 天前
在昇腾Atlas 300I Duo+openEuler上部署vLLM并进行推理的流程(一)
vllm
Anesthesia丶
7 天前
Qwen2.5-1.5b 模型部署与LORA训练笔记
pytorch
·
python
·
lora
·
llm
·
qwen
·
vllm
张忠琳
8 天前
【vllm】(五)vLLM v1 Attention — 模块超深度分析之五
ai
·
架构
·
vllm
热门推荐
01
GitHub 镜像站点
02
要裂开了!ChatGPT要手机号验证了?注册Codex要求验证电话号码怎么办?2026年登陆Codex要手机号验证的解决办法
03
裂开!ChatGPT 居然开始要手机号验证,附详细解决方法
04
Codex 接入 DeepSeek API 完整配置文档
05
【AI】2026 年具身智能模型和世界模型总结
06
2026年4月AI大事件深度解读:大模型竞争进入“深水区“
07
实测可用|小米 MiMo 百万亿 Token 免费领,开发者速冲
08
近期有什么ai的新消息,新动态? 2026.4月
09
在Windows 11上安装Docker的踩坑记录
10
2026年AI编程工具终极横评:Cursor vs Claude Code vs Copilot