Pod启动失败: /var/lib/kubelet/xxx/kube-api-access/ :no space left on device

一、问题现象

Pod调度至master01节点后,始终无法正常启动,K8s事件日志持续报出挂载卷失败错误,核心报错信息如下:

bash 复制代码
Warning  FailedMount  3m56s  kubelet            MountVolume.SetUp failed for volume "kube-api-access-gv4wg" : write /var/lib/kubelet/pods/44996eb7-d911-4748-ba01-cfe0a43da87e/volumes/kubernetes.io~projected/kube-api-access-gv4wg/..2026_03_19_06_31_37.2528622089/ca.crt: no space left on device
Warning  FailedMount  3m55s  kubelet            MountVolume.SetUp failed for volume "kube-api-access-gv4wg" : write /var/lib/kubelet/pods/44996eb7-d911-4748-ba01-cfe0a43da87e/volumes/kubernetes.io~projected/kube-api-access-gv4wg/..2026_03_19_06_31_38.709114551/token: no space left on device

通过以下命令初步排查节点资源,结果显示节点物理资源无异常:

bash 复制代码
# 排查节点根分区磁盘容量及使用率
df -h /
# 输出结果:
# Filesystem      Size  Used Avail Use% Mounted on
# /dev/sda1       197G   21G  168G  12% /

# 排查节点根分区inode使用率
df -i /
# 输出结果:
# Filesystem       Inodes  IUsed    IFree IUse% Mounted on
# /dev/sda1      13107200 170980 12936220    2% /

# 排查kubelet pods目录文件数量
ls -l /var/lib/kubelet/pods | wc -l
# 输出结果:17

排查结论:

  • 节点根分区磁盘容量总197G,已用21G,使用率12%,磁盘空间充足;
  • 节点inode使用率仅2%,无inode耗尽问题;
  • /var/lib/kubelet/pods目录文件数量仅17个,无异常文件堆积。

二、根因分析

此问题并非节点物理磁盘/inode资源耗尽,而是Pod内存资源限制配置错误导致的"逻辑空间不足":

  1. K8s中Pod的resources.limits.memory配置若未指定单位(如仅写512),会被默认解析为512字节(而非预期的512MB),该限额远低于Pod正常运行及挂载卷所需的最小内存;
  2. kube-api-access卷是K8s自动为Pod创建的投影卷(包含ca.crt、token等用于访问API Server的核心文件),挂载时需占用少量内存空间,因Pod内存限额仅512字节,触发内存耗尽,系统层面表现为"no space left on device";
  3. 补充:若配置为512mi(小写mi),K8s会识别为无效单位,同样会导致内存限额解析异常,标准单位应为Mi(1Mi=1024×1024字节)。

三、解决方案

1. 修正Pod内存资源限制配置

编辑Pod所属的控制器(以StatefulSet为例,Deployment操作逻辑一致):

bash 复制代码
kubectl edit statefulset nacos 

找到spec.template.spec.containers下的资源限制段,将错误配置:

yaml 复制代码
resources:
  limits:
    memory: 512  # 错误:无单位,默认512字节
  requests:
    memory: 512  # 错误:无单位,默认512字节

修改为正确配置(添加标准单位Mi):

yaml 复制代码
resources:
  limits:
    memory: 512Mi  # 正确:512兆字节,满足Pod运行及卷挂载需求   # 应该大写开头
  requests:
    memory: 256Mi  # 建议配置requests,值≤limits,提升调度合理性
相关推荐
databook7 分钟前
逃离SQL丛林:实用主义的数据救赎
后端·sql·数据分析
舒一笑43 分钟前
AI 系统落地难的,从来不只是模型:一次企业级部署实施复盘
运维·后端·程序员
心勤则明1 小时前
Spring AI Alibaba Skills 的渐进式披露与热更新实战
java·后端·spring
金融数据出海2 小时前
java对接美股股票api涵盖实时行情、K 线、指数等核心接口。
后端
认真的小羽❅2 小时前
从入门到精通:Spring Boot 整合 MyBatis 全攻略
spring boot·后端·mybatis
摆烂工程师2 小时前
教你如何查询 Codex 最新额度是多少,以及 ChatGPT Pro、Plus、Business 最新额度变化
前端·后端·ai编程
任聪聪2 小时前
我做了一款通用本地化部署模型运行调度器,运行所有大模型!
后端
开发者如是说2 小时前
可能是最好用的多语言管理工具
android·前端·后端
何陋轩4 小时前
AI时代,程序员何去何从?别慌,看完这篇你就明白了
后端·面试
weixin_408099674 小时前
OCR 识别率提升实战:模糊 / 倾斜 / 反光图片全套优化方案(附 Python / Java / PHP 代码)
图像处理·人工智能·后端·python·ocr·api·抠图