Docker 容器无法停止的排障与解决全过程

前言

在使用docker stop命令停止Nginx容器时,出现Error response from daemon: cannot stop container: a5c1bb8580d5: tried to kill container, but did not receive an exit event报错,常规操作难以解决。

问题现象

执行docker stop a5c1bb8580d5命令尝试停止目标Nginx容器时,Docker守护进程返回错误,提示无法停止容器,尝试杀死容器但未收到退出事件。

后续尝试docker inspect -f '{``{.State.Pid}}' a5c1bb8580d5查看容器对应的宿主机进程ID时,发现返回值为0 ,这意味着容器在Docker层面已经没有对应的进程记录,但容器资源却依然残留,常规的docker rm -f命令也无法将其删除。

问题排查

尝试强制停止容器

面对容器无法正常停止的情况,首先想到的是使用docker kill命令强制发送SIGKILL信号终止容器,命令如下:

bash 复制代码
docker kill a5c1bb8580d5

docker kill 仍失败,手动清理容器进程

复制代码
# 1. 查找容器对应的宿主机进程ID(PID)
docker inspect -f '{{.State.Pid}}' a5c1bb8580d5

# 2. 强制杀死该进程(替换为上一步查到的PID)
sudo kill -9 <查到的PID>

# 3. 清理残留的容器资源
docker rm -f a5c1bb8580d5

但执行后发现,该方法并未生效,容器依旧无法被停止和删除,因为容器 pid 为 0,说明进程在 Docker 层面已无记录,但容器仍残留,这是 Docker 的一种资源残留异常状态。

清理残留容器资源,解决问题

清理 PID 为 0 的残留容器

由于容器 PID 为 0,常规命令无法清理,需要绕过 Docker CLI,直接操作 Docker 的底层存储目录来删除残留资源,具体步骤如下:

停止 Docker 服务

注意:该操作会停止所有正在运行的容器,建议在业务低峰期执行,或提前做好业务容灾准备。

复制代码
# Ubuntu/Debian系统
sudo systemctl stop docker
# CentOS/RHEL系统
sudo service docker stop

删除容器残留文件

Docker 的容器数据默认存储在/var/lib/docker/containers/目录下,我们需要找到对应容器 ID 的文件夹并删除:

复制代码
# 进入容器存储目录
cd /var/lib/docker/containers/
# 查找目标容器的文件夹
ls -la | grep a5c1bb8580d5
# 删除该容器的残留文件夹
sudo rm -rf a5c1bb8580d5*

清理网络残留(可选)

如果存在网络关联残留问题,可以删除 Docker 网络的本地键值数据库文件:

复制代码
sudo rm -rf /var/lib/docker/network/files/local-kv.db

重启 Docker 服务

复制代码
# Ubuntu/Debian系统
sudo systemctl start docker
# CentOS/RHEL系统
sudo service docker start

验证清理结果

执行 docker ps -a 命令查看容器列表,确认目标容器已被清理。

相关推荐
赵文宇(温玉)9 小时前
Docker的生态与商业化
docker·容器·eureka
汉得数字平台9 小时前
班翎流程平台 | 班翎流程平台定时启动功能上线!流程自动化不用等
运维·自动化
大都督老师10 小时前
配置 containerd 使用镜像加速器拉取 Docker Hub 镜像
容器·kubernetes·k8s
HalvmånEver13 小时前
Linux:命名管道实现IPC(进程间通信七)
linux·运维·服务器·ipc·命名管道·管道pipe
zyu6718 小时前
03-Docker存储和网络
网络·docker·容器
正在学习前端的---小方同学18 小时前
Harbor部署教程
linux·运维
牛奔19 小时前
Docker Compose 两种安装与使用方式详解(适用于 Docker 19.03 版本)
运维·docker·云原生·容器·eureka
翼龙云_cloud19 小时前
阿里云渠道商:如何手动一键扩缩容ECS实例?
运维·服务器·阿里云·云计算
木童66220 小时前
Kubernetes 操作管理完全指南:从陈述式到声明式,覆盖全生命周期
云原生·容器·kubernetes