K8S节点磁盘空间不足导致502错误的排除

业务系统出现502错误,k8s dashboard也上不去了,执行命令

复制代码
kubectl get all -n kubernetes-dashboard

发现很多evicted pod

业务pod基本正常,但进不去,估计是ingress的问题。于是查看ingress-controller节点的磁盘空间,发现只剩下14%了,而k8s缺省要求有15%以上,估计是节点空间不足,把ingress-controller部署到其它节点了,于是,清理一些日志:

复制代码
# 1. 删除所有已停止容器的日志文件
find /var/lib/docker/containers -name "*.log" -type f -delete

# 2. 清理7天前的日志
find /var/lib/docker/containers -name "*.log" -type f -mtime +7 -delete

# 3. 清理大于100M的日志文件
find /var/lib/docker/containers -name "*.log" -type f -size +100M -delete

# 4. 安全清理(保留最近文件)
find /var/lib/docker/containers -name "*.log" \
  -type f \
  -mtime +30 \
  -exec rm -f {} \;

#5 删除Evicted节点
kubectl delete pods --all-namespaces --field-selector=status.phase=Failed

再看磁盘空间有17%了,接着就生启ingress pod吧

复制代码
kubectl rollout restart deployment -n ingress-nginx

再看业务系统正常了。

接下来就是扩充磁盘,减少日志等工作了。

复制代码
# 查看节点是否处于磁盘压力状态
kubectl describe node <node-name> | grep -i "diskpressure"

# 查看事件
kubectl get events --field-selector involvedObject.kind=Node,involvedObject.name=<node-name>
相关推荐
Paraverse_徐志斌2 小时前
K8S HPA + KEDA 弹性伸缩消费者解决 MQ 消息积压
容器·kafka·kubernetes·k8s·linq·hpa·keda
迎仔2 小时前
Kubernetes (K8s) 通俗原理解析:算力中心的“超级调度员”
云原生·容器·kubernetes
AC赳赳老秦2 小时前
文旅行业:DeepSeek处理客流数据生成预测模型与调度建议
人工智能·云原生·容器·kubernetes·notepad++·consul·deepseek
云栈开源日记2 小时前
Linux Kernel:云原生时代的操作系统内核
linux·运维·云原生
Asus.Blogs2 小时前
两个 Docker 容器如何通信?Docker 网络问题完整踩坑与解决指南
网络·docker·容器
linweidong2 小时前
K8s节点保卫战:基于Node Local DNS架构的磁盘自愈系统设计
运维·docker·云原生·容器·架构·kubernetes·k8s
kft13142 小时前
Grafana + OracleDB Exporter深度监控大屏(docker-compose版)
docker·容器·grafana
紫神2 小时前
解决kubevirt安装的windows7系统存在鼠标分裂的问题
云原生·计算机外设·kubevirt
jiayong233 小时前
Kubernetes 高级特性与实战面试题详解
容器·贪心算法·kubernetes