容器参数错误,更换参数

停止旧容器 → 删除旧容器 → 启动新容器」的步骤操作,确保操作安全且不丢失关键数据(模型文件、日志等都已挂载到宿主机,不会丢失)。

第一步:停止正在运行的旧容器 先执行停止命令,确保容器正常退出:

```bash docker stop vllm_qwen35_9b ```

执行后会输出容器名称/ID,表示停止成功。

第二步:删除旧容器(可选但推荐) 停止后删除旧容器,避免名称冲突和残留资源:

```bash docker rm vllm_qwen35_9b ```

如果提示容器不存在,说明名称可能有误,可先用`docker ps -a`查看所有容器,确认目标容器名称/ID。

第三步:启动修改后的单卡容器 直接执行我之前给你的**修改后完整命令**(单GPU版本): ```bash docker run -d --name vllm_qwen35_9b --restart always --gpus '"device=0"' --net=host --privileged --ipc=host -v /home/hynx/models/Qwen3.5-9B:/app/model/qwen3.5-9b -v /home/hynx/vllm_cache:/root/.cache/huggingface -v /home/hynx/vllm_log:/app/log vllm/vllm-openai:latest /app/model/qwen3.5-9b --host 0.0.0.0 --port 8089 --dtype auto --max-model-len 262144 --reasoning-parser qwen3 --tensor-parallel-size 1 --gpu-memory-utilization 0.9 --no-enforce-eager --served-model-name qwen3.5-9b ```

第四步:验证是否成功运行在第一块GPU

  1. 先查看容器是否正常启动:

```bash docker ps | grep vllm_qwen35_9b ```

如果能看到容器信息,说明启动成功。

  1. 验证GPU使用情况(关键):

```bash nvidia-smi ```

在输出的「Processes」部分,会看到vllm进程只占用**GPU 0**(第一块),而不是之前的多块GPU,说明配置生效。

  1. 可选:测试API是否可用(确认服务没出问题): ```bash curl http://localhost:8089/v1/chat/completions \ -H "Content-Type: application/json" \ -d '{ "model": "qwen3.5-9b", "messages": [{"role": "user", "content": "测试一下"}] }' ```

能正常返回回复,说明服务完全可用。

注意事项 - 操作过程中,模型文件、日志、缓存都挂载在宿主机目录(`/home/hynx/`下),不会因为删除/重建容器丢失; - 如果启动新容器时报「端口8089被占用」,先执行

`netstat -tulpn | grep 8089`

查看占用进程,确认是旧容器残留的话,重启Docker(`systemctl restart docker`)即可解决。

总结

  1. 操作流程:停止旧容器 → 删除旧容器 → 启动单GPU新容器;

  2. 验证重点:用`nvidia-smi`确认进程仅占用GPU 0,用curl测试API可用性;

  3. 数据安全:模型/日志/缓存都在宿主机,重建容器不会丢失数据。

相关推荐
从孑开始1 分钟前
manyspeech-cli 语音识别命令行工具
人工智能·语音识别·工具·asr
hans汉斯11 分钟前
计算机科学与应用|基于大模型深度语义理解的智能内容纠错系统
人工智能·计算机视觉·视觉检测·数据·病虫害检测
Mr数据杨20 分钟前
【CanMV K210】视觉识别 颜色阈值分割与色块检测实验
人工智能·硬件开发·canmv k210
Bruce_Liuxiaowei23 分钟前
OpenClaw 网关启动失败:配置文件权限错误的排查与修复
人工智能·智能体
kobesdu31 分钟前
【ROS2实战笔记-18】ROS2 通信的隐秘控制:DDS 配置参数如何决定系统性能
网络·人工智能·笔记·机器人·开源·ros·人形机器人
组合缺一34 分钟前
Java AI 框架三国杀:Solon AI vs Spring AI vs LangChain4j 深度对比
java·人工智能·spring·ai·langchain·llm·solon
碳基硅坊44 分钟前
GPT-5.5 vs Claude Opus 4.7:两大顶级模型的深度横评
人工智能·claude opus 4.7·gpt 5.5
eastyuxiao1 小时前
第二章 数字孪生核心技术体系
大数据·人工智能·数字孪生
xwz小王子1 小时前
刚刚,诺奖得主David Baker团队Nature发文:AI正从“造分子”迈向“造机器”
人工智能
humcomm1 小时前
边缘计算如何与云原生技术结合
人工智能·云原生·边缘计算