ES 在大查询场景下导致 GC 频繁，如何定位和解决？

bash 复制代码

# 查看Elasticsearch节点JVM配置
GET /_nodes/jvm

重点关注heap_max_in_bytes和垃圾回收器类型（G1/CMS）

yaml:config/jvm.options 复制代码

# 启用GC日志（需重启集群）
-Xlog:gc*,gc+age=trace,safepoint:file=logs/gc.log:utctime,pid,tags:filecount=32,filesize=64m

bash 复制代码

# 实时监控内存使用
GET /_nodes/stats/jvm?filter_path=**.heap_used_percent

yaml:config/jvm.options 复制代码

# 调整G1GC参数（适用于JDK11+）
-XX:+UseG1GC
-XX:G1ReservePercent=25
-XX:InitiatingHeapOccupancyPercent=30
-XX:MaxGCPauseMillis=200

json 复制代码

// 避免深度分页
GET /index/_search
{
  "query": {...},
  "size": 100,
  "sort": "_doc",  // 无评分排序
  "track_total_hits": false
}

bash 复制代码

# 设置doc_values优化字段存储
PUT /index/_mapping
{
  "properties": {
    "large_field": {
      "type": "keyword",
      "doc_values": true
    }
  }
}

yaml:config/elasticsearch.yml 复制代码

indices.requests.cache.size: 5%
indices.queries.cache.size: 5%
indices.fielddata.cache.size: 30%

yaml:config/elasticsearch.yml 复制代码

thread_pool.search.size: 4  # 建议等于CPU核心数
thread_pool.search.queue_size: 1000

bash 复制代码

# 实时监控GC状态（需节点安装JDK）
jstat -gcutil <pid> 1000 10

json 复制代码

GET /index/_profile
{
  "query": {...}
}

bash 复制代码

PUT /_cluster/settings
{
  "transient": {
    "search.default_pre_filter_shard_size": 128
  }
}

建议优先从查询优化和JVM参数调整入手，同时结合GC日志分析具体GC类型（Young GC/Full GC）和停顿时间。若频繁出现Full GC，需重点检查内存泄漏或大对象分配问题。