Elasticsearch索引恢复

大A崛起2023-09-19 19:11

一、查看分片失败原因

powershell 复制代码

GET /_cluster/allocation/explain
GET _cat/indices?v&health=red
GET /_cat/shards?v&h=n,index,shard,prirep,state,sto,sc,unassigned.reason,unassigned.details
ALLOCATION_FAILED：由于分片分配失败而未分配。
CLUSTER_RECOVERED：由于集群恢复而未分配。
DANGLING_INDEX_IMPORTED：由于导入了悬空索引导致未分配。
EXISTING_INDEX_RESTORED：由于恢复为已关闭的索引导致未分配。
INDEX_CREATED：由于API创建索引而未分配。
INDEX_REOPENED：由于打开已关闭索引而未分配。
NEW_INDEX_RESTORED：由于恢复到新索引而未分配。
NODE_LEFT：由于托管的节点离开集群而未分配。
REALLOCATED_REPLICA：确定了更好的副本位置，并导致现有副本分配被取消。
REINITIALIZED：当分片从开始移动回初始化，导致未分配。
REPLICA_ADDED：由于显式添加副本而未分配。
REROUTE_CANCELLED：由于显式取消重新路由命令而未分配。

查看es中未分配的分片

powershell 复制代码

curl -XGET localhost:9200/_cat/shards?h=index,shard,prirep,state,unassigned.reason| grep UNASSIGNED

二、尝试重新分配失败的分片

如果未分配的分片比较多，建议打开retry_failed=true。

powershell 复制代码

POST /_cluster/reroute?retry_failed=true

shard 自动分配已经达到最大重试次数5次，仍然失败了，所以导致"shard的分配状态已经是：no_attempt"。

powershell 复制代码

PUT /indexname/_settings
{
  "index": {
    "allocation": {
      "max_retries": 20
    }
  }
}

推荐一个es web工具,可以帮助我们排查es相关问题。

链接：https://github.com/lmenezes/cerebro