ElasticSearch服务端报错:FileSystemException: No space left on device

一、确认问题

  1. elasticsearch节点启动失败

  2. elasticsearch节点集群日志中有类似如下报错

    bash 复制代码
    ElasticsearchException: java.nio.file.FileSystemException: /usr/share/elasticsearch/workspace/data/nodes/0/state/_13qo.fdt: No space left on device

二、处理办法

问题原因

  • 主机磁盘空间不足
  • 正常情况下ES自身是有磁盘水位线(cluster.routing.allocation.disk.watermark)的设置,存储数据目录在非人为解除只读情况下不会打满磁盘,需要确认导致磁盘打满的根本原因,大致有以下方向:
    1. 水位线达到阈值后触发集群只读,运维人员手动解除了只读
    2. 集群日志级别过低,并且没有配置好滚动策略导致日志无法滚动或保存日志数量过大
      3.与其他服务共用了一块存储,其他服务打爆了磁盘

处理办法

根据 问题原因 中指出的思路排查出问题根本原因并按照以下思路处理

  1. 删除磁盘上服务的日志类文件,给ES留出能正常运行的空间

  2. 节点能够正常启动后立即设置集群只读可删

    bash 复制代码
    curl -s -XPUT -H "Content-Type: application/json" es访问地址/_cluster/settings -d '{"persistent": {"cluster.blocks.read_only_allow_delete": true}}'
  3. 删除ES集群监控类索引

    bash 复制代码
    curl -s -XDELETE es访问地址/.monitoring-es*
  4. 给数据量大、按时间创建的索引设置生命周期,只保留一定期限内的数据,超过期限的删除,关于索引生命周期管理(ILM)可参考https://elasticstack.blog.csdn.net/article/details/102728987

  5. 若与其他服务共用磁盘,建议拆分开,避免服务之间相互干扰,增加运维难度

  6. 最后处理完磁盘空间问题后,需要取消集群只读的设置

    bash 复制代码
    ​curl -s -XPUT -H "Content-Type: application/json" es访问地址/_cluster/settings -d '{"persistent": {"cluster.blocks.read_only_allow_delete": null}}'
相关推荐
武子康1 天前
大数据-237 离线数仓 - Hive 广告业务实战:ODS→DWD 事件解析、广告明细与转化分析落地
大数据·后端·apache hive
大大大大晴天1 天前
Flink生产问题排障-Kryo serializer scala extensions are not available
大数据·flink
Elasticsearch2 天前
如何使用 Agent Builder 排查 Kubernetes Pod 重启和 OOMKilled 事件
elasticsearch
Elasticsearch3 天前
通用表达式语言 ( CEL ): CEL 输入如何改进 Elastic Agent 集成中的数据收集
elasticsearch
武子康3 天前
大数据-236 离线数仓 - 会员指标验证、DataX 导出与广告业务 ODS/DWD/ADS 全流程
大数据·后端·apache hive
武子康4 天前
大数据-235 离线数仓 - 实战:Flume+HDFS+Hive 搭建 ODS/DWD/DWS/ADS 会员分析链路
大数据·后端·apache hive
DianSan_ERP5 天前
电商API接口全链路监控:构建坚不可摧的线上运维防线
大数据·运维·网络·人工智能·git·servlet
够快云库5 天前
能源行业非结构化数据治理实战:从数据沼泽到智能资产
大数据·人工智能·机器学习·企业文件安全
AI周红伟5 天前
周红伟:智能体全栈构建实操:OpenClaw部署+Agent Skills+Seedance+RAG从入门到实战
大数据·人工智能·大模型·智能体
B站计算机毕业设计超人5 天前
计算机毕业设计Django+Vue.js高考推荐系统 高考可视化 大数据毕业设计(源码+LW文档+PPT+详细讲解)
大数据·vue.js·hadoop·django·毕业设计·课程设计·推荐算法