Kubernetes 节点磁盘空间空了怎么办?解决 containerd overlay 100%问题

Kubernetes 节点磁盘空间空了怎么办?解决 containerd overlay 100%问题

当 Kubernetes 集群中的节点出现如下错误:

bash 复制代码
MountVolume.SetUp failed for volume xxx: no space left on device

或者执行 df -h 显示:

复制代码
/dev/mapper/centos-root   50G   50G   0G  100% /
overlay                   50G   50G   0G  100% /run/containerd/io.containerd.runtime...

这意味着 根分区 / 空间已满,containerd 依赖 overlayfs 已无法写入,导致 Pod 创建失败。


一、问题原因

  1. containerd 将所有容器 rootfs overlay 挂载到 / 分区
  2. /var/lib/containerd, /var/lib/kubelet 空间大量占用
  3. /var/log 系统日志、Pod 输出日志积历

二、快速解决方案

清理 containerd 無用容器和镜像

bash 复制代码
# 清理容器
ctr -n k8s.io containers ls
ctr -n k8s.io containers rm $(ctr -n k8s.io containers ls -q)

# 清理镜像
ctr -n k8s.io images ls
ctr -n k8s.io images rm $(ctr -n k8s.io images ls -q)

清除 kubelet 临时 pod 目录

bash 复制代码
systemctl stop kubelet
rm -rf /var/lib/kubelet/pods/*
systemctl start kubelet

清除系统日志

bash 复制代码
journalctl --vacuum-time=1d
find /var/log -type f -exec truncate -s 0 {} \;

三、持久解决方案:将 containerd & kubelet 数据目录移动到大盘 /home

步骤 1: 停止服务

bash 复制代码
systemctl stop kubelet
systemctl stop containerd

步骤 2: 移动数据 + 设置软连接

bash 复制代码
mv /var/lib/containerd /home/containerd_data
mv /var/lib/kubelet /home/kubelet_data

# 建立软连接
ln -s /home/containerd_data /var/lib/containerd
ln -s /home/kubelet_data /var/lib/kubelet

步骤 3: 重启服务

bash 复制代码
systemctl start containerd
systemctl start kubelet

步骤 4: 确认解决

bash 复制代码
df -h /
kubectl get nodes

四、建议配套

建议配合 cron 时间件定期清理

bash 复制代码
cat > /usr/local/bin/clean-logs.sh <<EOF
#!/bin/bash
journalctl --rotate
journalctl --vacuum-time=1d
find /var/log -type f -exec truncate -s 0 {} \;
EOF

chmod +x /usr/local/bin/clean-logs.sh
echo "0 3 * * * root /usr/local/bin/clean-logs.sh" >> /etc/crontab

如果需要 containerd root 目录指定

toml 复制代码
# /etc/containerd/config.toml
root = "/home/containerd_data"
state = "/home/containerd_state"
bash 复制代码
systemctl daemon-reexec
systemctl restart containerd

如果需要修改 kubelet 启动参数(如使用 systemd):

编辑/etc/systemd/system/kubelet.service.d/10-kubeadm.conf中加入:

bash 复制代码
--root-dir=/home/kubelet_data

结论

问题 原因 解决方案
节点 / 分区 100% containerd + kubelet + logs 占满 移动到 /home
Pod 无法创建 overlay rootfs 写入失败 重启服务释放空间
kubelet 出现 FailedMount pod 目录无法 mkdir 移目录 + 空间利用

相关推荐
雪可问春风19 小时前
docker环境部署
运维·docker·容器
AI攻城狮19 小时前
用 Obsidian CLI + LLM 构建本地 RAG:让你的笔记真正「活」起来
人工智能·云原生·aigc
科技小花21 小时前
AI重塑数据治理:2026年核心方案评估与场景适配
大数据·人工智能·云原生·ai原生
kobe_OKOK_21 小时前
S7 adapter Docker run
运维·docker·容器
阿里云云原生21 小时前
基于 HiClaw 的运维场景多智能体协同实践
云原生
阿里云云原生1 天前
从 OpenSearch 到阿里云 SLS:极致弹性、更低成本、生态兼容
云原生
yuanlaile1 天前
从入门到部署|2026年Koa全栈开发实战:覆盖Node.js、数据库、部署与云架构全链路
微服务·云原生·kubernetes·node.js·serverless·nodejs全栈开发
Learn-Python1 天前
修改docker容器内文件后让其生效
运维·docker·容器
http阿拉丁神猫1 天前
kubernetes知识点汇总37-42
云原生·容器·kubernetes
L1624761 天前
Containerd 完整部署安装与使用指南
容器