Pod启动失败: /var/lib/kubelet/xxx/kube-api-access/ :no space left on device

一、问题现象

Pod调度至master01节点后,始终无法正常启动,K8s事件日志持续报出挂载卷失败错误,核心报错信息如下:

bash 复制代码
Warning  FailedMount  3m56s  kubelet            MountVolume.SetUp failed for volume "kube-api-access-gv4wg" : write /var/lib/kubelet/pods/44996eb7-d911-4748-ba01-cfe0a43da87e/volumes/kubernetes.io~projected/kube-api-access-gv4wg/..2026_03_19_06_31_37.2528622089/ca.crt: no space left on device
Warning  FailedMount  3m55s  kubelet            MountVolume.SetUp failed for volume "kube-api-access-gv4wg" : write /var/lib/kubelet/pods/44996eb7-d911-4748-ba01-cfe0a43da87e/volumes/kubernetes.io~projected/kube-api-access-gv4wg/..2026_03_19_06_31_38.709114551/token: no space left on device

通过以下命令初步排查节点资源,结果显示节点物理资源无异常:

bash 复制代码
# 排查节点根分区磁盘容量及使用率
df -h /
# 输出结果:
# Filesystem      Size  Used Avail Use% Mounted on
# /dev/sda1       197G   21G  168G  12% /

# 排查节点根分区inode使用率
df -i /
# 输出结果:
# Filesystem       Inodes  IUsed    IFree IUse% Mounted on
# /dev/sda1      13107200 170980 12936220    2% /

# 排查kubelet pods目录文件数量
ls -l /var/lib/kubelet/pods | wc -l
# 输出结果:17

排查结论:

  • 节点根分区磁盘容量总197G,已用21G,使用率12%,磁盘空间充足;
  • 节点inode使用率仅2%,无inode耗尽问题;
  • /var/lib/kubelet/pods目录文件数量仅17个,无异常文件堆积。

二、根因分析

此问题并非节点物理磁盘/inode资源耗尽,而是Pod内存资源限制配置错误导致的"逻辑空间不足":

  1. K8s中Pod的resources.limits.memory配置若未指定单位(如仅写512),会被默认解析为512字节(而非预期的512MB),该限额远低于Pod正常运行及挂载卷所需的最小内存;
  2. kube-api-access卷是K8s自动为Pod创建的投影卷(包含ca.crt、token等用于访问API Server的核心文件),挂载时需占用少量内存空间,因Pod内存限额仅512字节,触发内存耗尽,系统层面表现为"no space left on device";
  3. 补充:若配置为512mi(小写mi),K8s会识别为无效单位,同样会导致内存限额解析异常,标准单位应为Mi(1Mi=1024×1024字节)。

三、解决方案

1. 修正Pod内存资源限制配置

编辑Pod所属的控制器(以StatefulSet为例,Deployment操作逻辑一致):

bash 复制代码
kubectl edit statefulset nacos 

找到spec.template.spec.containers下的资源限制段,将错误配置:

yaml 复制代码
resources:
  limits:
    memory: 512  # 错误:无单位,默认512字节
  requests:
    memory: 512  # 错误:无单位,默认512字节

修改为正确配置(添加标准单位Mi):

yaml 复制代码
resources:
  limits:
    memory: 512Mi  # 正确:512兆字节,满足Pod运行及卷挂载需求   # 应该大写开头
  requests:
    memory: 256Mi  # 建议配置requests,值≤limits,提升调度合理性
相关推荐
陈随易7 小时前
编程语言级别的Skill市场,AI Agent 的未来形态
前端·后端·程序员
IT_陈寒9 小时前
Vite的热更新突然不香了,排查三小时差点砸键盘
前端·人工智能·后端
子兮曰10 小时前
Agency-Agents 深度解析:400+ AI 专家的"梦之队"如何重塑开发工作流
前端·后端·vibecoding
用户83562907805110 小时前
Python 实现 PDF 文件加密与解密方法
后端·python
小满zs10 小时前
Go语言第二章(小无相功)
后端·go
用户83562907805110 小时前
使用 Python 冻结与拆分 Excel 窗格教程
后端·python
karry_k11 小时前
MyBatis批量insert-select踩坑:useGeneratedKeys=true 可能让PostgreSQL返回大量插入结果
java·后端
妙码生花11 小时前
从 PHP 到 AI + Golang,程序员自救转型手记(十九):点选验证码代码逐行目检
前端·后端·go
贰先生11 小时前
Xiuno BBS X版 用户封禁系统
后端
karry_k11 小时前
PostgreSQL 在 MyBatis 中执行正常 SQL 失效:一次 DELETE USING 踩坑记录
java·后端