容器参数错误,更换参数

停止旧容器 → 删除旧容器 → 启动新容器」的步骤操作,确保操作安全且不丢失关键数据(模型文件、日志等都已挂载到宿主机,不会丢失)。

第一步:停止正在运行的旧容器 先执行停止命令,确保容器正常退出:

```bash docker stop vllm_qwen35_9b ```

执行后会输出容器名称/ID,表示停止成功。

第二步:删除旧容器(可选但推荐) 停止后删除旧容器,避免名称冲突和残留资源:

```bash docker rm vllm_qwen35_9b ```

如果提示容器不存在,说明名称可能有误,可先用`docker ps -a`查看所有容器,确认目标容器名称/ID。

第三步:启动修改后的单卡容器 直接执行我之前给你的**修改后完整命令**(单GPU版本): ```bash docker run -d --name vllm_qwen35_9b --restart always --gpus '"device=0"' --net=host --privileged --ipc=host -v /home/hynx/models/Qwen3.5-9B:/app/model/qwen3.5-9b -v /home/hynx/vllm_cache:/root/.cache/huggingface -v /home/hynx/vllm_log:/app/log vllm/vllm-openai:latest /app/model/qwen3.5-9b --host 0.0.0.0 --port 8089 --dtype auto --max-model-len 262144 --reasoning-parser qwen3 --tensor-parallel-size 1 --gpu-memory-utilization 0.9 --no-enforce-eager --served-model-name qwen3.5-9b ```

第四步:验证是否成功运行在第一块GPU

  1. 先查看容器是否正常启动:

```bash docker ps | grep vllm_qwen35_9b ```

如果能看到容器信息,说明启动成功。

  1. 验证GPU使用情况(关键):

```bash nvidia-smi ```

在输出的「Processes」部分,会看到vllm进程只占用**GPU 0**(第一块),而不是之前的多块GPU,说明配置生效。

  1. 可选:测试API是否可用(确认服务没出问题): ```bash curl http://localhost:8089/v1/chat/completions \ -H "Content-Type: application/json" \ -d '{ "model": "qwen3.5-9b", "messages": [{"role": "user", "content": "测试一下"}] }' ```

能正常返回回复,说明服务完全可用。

注意事项 - 操作过程中,模型文件、日志、缓存都挂载在宿主机目录(`/home/hynx/`下),不会因为删除/重建容器丢失; - 如果启动新容器时报「端口8089被占用」,先执行

`netstat -tulpn | grep 8089`

查看占用进程,确认是旧容器残留的话,重启Docker(`systemctl restart docker`)即可解决。

总结

  1. 操作流程:停止旧容器 → 删除旧容器 → 启动单GPU新容器;

  2. 验证重点:用`nvidia-smi`确认进程仅占用GPU 0,用curl测试API可用性;

  3. 数据安全:模型/日志/缓存都在宿主机,重建容器不会丢失数据。

相关推荐
GOWIN革文品牌咨询2 小时前
AI入口下的B2B品牌升级:从内容堆积到标准答案位的重构方法
人工智能·重构·智能设备·工业软件·b2b品牌策划·b2b品牌设计
Shining05962 小时前
推理引擎系列(七)《InfiniLM》
人工智能·深度学习·算法·大模型·ai芯片·智能体·推理引擎
晨非辰2 小时前
Linux终端输出哲学:从回车换行到进度条实战,掌握缓冲区刷新与ANSI控制,告别输出延迟焦虑
linux·运维·服务器·c++·人工智能·后端·自动化
赵孝正2 小时前
Python分块计算(Chunk Processing)详解:解决大规模数据内存溢出的工程实践
数据库·人工智能·python
lpfasd1232 小时前
2026年第12周GitHub趋势周报:Claude生态爆发,AI工程化加速,开发者工具链重构
人工智能·重构·github
无巧不成书02182 小时前
【开源AI视频笔记工具】BiliNote部署教程:本地+Docker双方案,小白也能轻松上手!
人工智能·开源·音视频·bilinote部署教程·cookie获取
同元软控2 小时前
同元“AI工程七步法”实践:把桌面CAD搬到Web
前端·人工智能
Dfreedom.2 小时前
集成学习完全解析:从核心思想到常见误区
人工智能·机器学习·集成学习
杜子不疼.2 小时前
Linux 部署 RocketMQ 实操:从内网到公网,搞定远程消息服务
linux·运维·人工智能·rocketmq