K8S服务突然中断无法访问:报The node had condition: [DiskPressure]异常

一、背景

程序在运行过程中,突然无法访问,发现后台接口也无法访问;查看kuboard,发现报如下异常:The node had condition: [DiskPressure].

继续查看磁盘使用率,发现系统盘使用率已经高达93%。问题前后呼应找到问题所在。

二、解释

‌DiskPressure‌是指在Kubernetes集群中,节点上的磁盘使用率过高,导致系统无法为新的Pod分配足够的存储空间。这种情况会导致节点进入"DiskPressure"状态,进而影响节点的资源管理和应用程序的运行。

三、解决办法

解决办法一般有如下几种方式:其中最简单常用的就是:扩展磁盘容量、清理磁盘空间

  1. 清理磁盘空间‌:删除不必要的文件或转移文件到其他存储设备上,以释放磁盘空间。
  2. 优化磁盘使用‌:检查应用程序或服务的磁盘使用情况,可能需要调整配置或使用更高效的算法。
  3. 增加磁盘容量‌:如果磁盘空间不足,可以考虑增加磁盘容量,例如添加新的磁盘或扩展现有的磁盘。
  4. 优化节点资源‌:如果节点上运行的应用程序或服务过多,可能需要重新分配资源或添加新的节点来分担负载。

清理磁盘空间后(谨慎删除一些过期的日志,文件等),程序自动重启,变为正常,程序也恢复正常访问。如下:

END

相关推荐
苦逼IT运维22 分钟前
从 0 到 1 理解 Kubernetes:一次“破坏式”学习实践(一)
linux·学习·docker·容器·kubernetes
萧曵 丶30 分钟前
Docker 面试题
运维·docker·容器
晨港飞燕37 分钟前
容器,pod,节点概念
容器
腾讯云开发者44 分钟前
言出法随 -- Chaterm如何通过ASR精准操作K8S
云原生·容器·kubernetes
为什么不问问神奇的海螺呢丶1 小时前
n9e categraf docker 监控配置
运维·docker·容器
青树寒鸦1 小时前
wsl的docker备份mongo和迁移
运维·mongodb·docker·容器
伟大的大威2 小时前
NVIDIA DGX Spark (ARM64/Blackwell) Kubernetes 集群 + GPU Operator 完整部署指南
大数据·spark·kubernetes
爱宇阳4 小时前
WSL2 完整开发环境配置指南
容器
hopsky4 小时前
Docker Desktop 报 500
运维·docker·容器
only_Klein4 小时前
kubernetes Pod 通信过程演示
网络·kubernetes·tcpdump