ElasticSearch集群内存占用高?如何降低内存占用看这篇文章就够啦!(冻结索引)

ElasticSearch集群内存占用高?如果降低内存占用看这篇文章就够啦

一、冻结索引的介绍

经常搜索的索引被保留在内存中,因为重建索引和帮助高效搜索需要花费时间。另一方面,可能存在我们很少访问的索引。这些索引不需要占用内存,可以在需要时进行重建。这样的索引称为冻结索引。

每当搜索分片时,Elasticsearch都会构建冻结索引的每个分片的即时数据结构,并在搜索完成后立即丢弃这些数据结构。因为Elasticsearch不会在内存中维护这些临时数据结构,所以冻结索引消耗的堆要比普通索引少得多。与其他方式相比,这允许更高的磁盘与堆的比率。

总结来说索引的冻结是Elasticsearch提供的一个用于减少内存开销的操作,这个功能在7.14版本中被标记为​​Deprecated​​,在Version 8以后,已经对堆内存的使用进行了改进,冻结和解冻的功能不再适用,但在Version 8以前的版本中不失为一个可行的优化方案。

二、索引冻结和解冻示例及注意事项

rust 复制代码
冻结和解冻示例
POST /index_name/_freeze  -- 冻结
POST /index_name/_unfreeze  -- 解冻

冻结索引示例

  1. 预期对冻结索引的搜索将缓慢执行。冻结索引不适用于较高的搜索负载。对未冻结的索引进行的搜索在几毫秒内完成,对冻结索引的搜索也可能需要数秒或数分钟才能完成。
  2. 索引冻结以后除了保存一些必要的元数据信息意外,将不再占用系统负载,索引将会变成只读,不再提供写入的能力,类似force
    merge等操作也将无法执行。
  3. 冻结特别注意:当前正在写的索引不能被冻结,并且执行了冻结操作以后,会将索引先进行close,然后再open,在这段时间内,可能导致主分片没有被分配,集群可能短暂出现red状态,open结束后恢复。
  4. 冻结索引是一个阻塞操作,意味着在冻结期间,该索引将无法进行任何写入和读取操作。因此,在使用冻结和解冻命令时,请确保在适当的时间进行操作,以避免对索引的可用性造成负面影响。
    解冻索引示例
  5. 需求解冻的过程中,同样会将索引先进行close,然后再open,在这段时间内,索引不可查询,集群可能短暂出现red状态,open结束后恢复。
  6. 解冻特别注意:在再次冻结索引之前,一定要运行"force_merge",以确保最佳性能。
  7. 解冻后,该索引将重新启用新的文档写入,并恢复正常的搜索和读取操作。

三、搜索冻结索引

  1. 索引被冻结后如果按照之前的查询语句请求数据是拿不到数据的,示例如下:


  1. 每个节点的并发加载的冻结索引数受search_throttled线程池中的线程数限制,默认情况下为1。要包含冻结索引,必须使用查询参数?ignore_throttled = false来执行搜索请求。

四、冻结索引在Java代码中的实现

  1. 首先需要引入ElasticSearch的依赖,这里我使用的是7.6.2,冻结索引的概念存在于7.X版本中,如果你的es版本低于7.X,请记得升级版本
xml 复制代码
<!-- 新增 elasticsearch相关依赖 -->
        <dependency>
            <groupId>org.elasticsearch</groupId>
            <artifactId>elasticsearch</artifactId>
            <version>7.6.2</version>
        </dependency>
        <!-- elasticsearch的客户端 -->
        <dependency>
            <groupId>org.elasticsearch.client</groupId>
            <artifactId>elasticsearch-rest-high-level-client</artifactId>
            <version>7.6.2</version>
        </dependency>

在 Elasticsearch 6.X 版本中,searchRequest.setIgnoreThrottled(false) 方法已经被废弃。取而代之的是使用 IndicesOptions 类来设置索引选项。要设置 ignoreThrottled 参数为 false,您可以使用 IndicesOptions.fromOptions() 方法并传递适当的参数。

  1. 以下是一个示例代码片段,展示如何通过其他方法将 ignoreThrottled 参数设置为 false:
java 复制代码
import org.elasticsearch.action.search.SearchRequest;  
import org.elasticsearch.indices.options.IndicesOptions;  
  
// 创建 SearchRequest 对象  
SearchRequest searchRequest = new SearchRequest("index_name");  
  
// 设置 IndicesOptions 对象  
IndicesOptions options = IndicesOptions.fromOptions(false, false, false, false, false, false, false, false);  
searchRequest.indicesOptions(options);  
  
// 执行搜索请求  
SearchResponse searchResponse = client.search(searchRequest, RequestOptions.DEFAULT);  
  
// 处理搜索结果  
SearchHit[] hits = searchResponse.getHits().getHits();  
// 处理搜索结果...

在上述代码中,我们首先创建了一个 SearchRequest 对象,然后使用 IndicesOptions.fromOptions() 方法创建了一个 IndicesOptions 对象,并将参数设置为 false。接下来,我们通过调用 searchRequest.indicesOptions(options) 将该选项对象设置到搜索请求中。这样,搜索请求将遵循指定的索引选项,而不使用默认的 ignoreThrottled 参数值。

  1. 注意 :请确保将 "index_name" 替换为您要搜索的实际索引名称,并根据您的需求调整其他参数。此外,由于 Elasticsearch
    的版本更新和 API 变化,建议查阅官方文档以获取最新和准确的信息。

五、解决Elasticsearch集群内存占用高的问题方法集锦:

Elasticsearch集群内存占用高的问题可能有多种原因,解决方法也会因情况而异。以下是一些可能的解决方法:

  1. 优化查询语句:确保查询语句简洁、高效,避免不必要的聚合和排序操作。这可以减少查询过程中的计算量和内存消耗。
  2. 分页查询:对于大量数据的查询,尽量使用分页查询,避免一次性查询大量数据。通过限制返回的文档数量,可以减少内存消耗。
  3. 调整索引设置:根据实际需求,调整索引的设置,如最大字段长度、分析器等。避免索引过多的数据,以降低内存消耗。
  4. 调整分片和副本:根据实际需求,调整分片和副本的数量。过多的分片和副本可能会导致内存占用增加。
  5. 监控内存使用情况:使用Elasticsearch提供的监控工具,如Elasticsearch
    Monitoring、Elasticsearch Head等,及时发现内存使用异常,采取相应措施。
  6. 调整JVM内存设置:根据实际情况,调整Elasticsearch
    JVM的内存设置。通过合理分配JVM堆大小和垃圾回收设置,可以优化内存使用效率。
  7. 定期清理数据:对于不再需要的旧数据,及时删除或归档,以释放内存空间。
  8. 使用更新的Elasticsearch版本:定期更新Elasticsearch版本,因为每个版本都会进行性能优化和改进。使用最新的稳定版可能有助于降低内存消耗。
  9. 分布式查询:如果单个节点的性能不足以满足查询需求,可以考虑使用分布式查询。将查询请求分散到多个节点上执行,可以加快查询速度并降低单节点内存消耗。
  10. 使用缓存:如果查询结果是可以缓存的,尽量利用缓存来提高查询性能。将经常使用的查询结果缓存起来,可以避免重复计算,提高查询效率。

综上所述,解决Elasticsearch集群内存占用高的问题需要从多个方面入手,包括优化查询语句、调整索引和分片设置、监控内存使用情况、调整JVM内存设置、定期清理数据、使用更新的Elasticsearch版本、分布式查询和使用缓存等。根据实际情况选择合适的解决方法可以有效地降低内存消耗并提高查询性能。

有关冻结索引的详细内容请参考:官方文档说明冻结索引

相关推荐
Qspace丨轻空间2 小时前
气膜场馆:推动体育文化旅游创新发展的关键力量—轻空间
大数据·人工智能·安全·生活·娱乐
Elastic 中国社区官方博客3 小时前
如何将数据从 AWS S3 导入到 Elastic Cloud - 第 3 部分:Elastic S3 连接器
大数据·elasticsearch·搜索引擎·云计算·全文检索·可用性测试·aws
掘金-我是哪吒3 小时前
微服务mysql,redis,elasticsearch, kibana,cassandra,mongodb, kafka
redis·mysql·mongodb·elasticsearch·微服务
Aloudata4 小时前
从Apache Atlas到Aloudata BIG,数据血缘解析有何改变?
大数据·apache·数据血缘·主动元数据·数据链路
水豚AI课代表4 小时前
分析报告、调研报告、工作方案等的提示词
大数据·人工智能·学习·chatgpt·aigc
研究是为了理解4 小时前
Git Bash 常用命令
git·elasticsearch·bash
拓端研究室TRL7 小时前
【梯度提升专题】XGBoost、Adaboost、CatBoost预测合集:抗乳腺癌药物优化、信贷风控、比特币应用|附数据代码...
大数据
黄焖鸡能干四碗7 小时前
信息化运维方案,实施方案,开发方案,信息中心安全运维资料(软件资料word)
大数据·人工智能·软件需求·设计规范·规格说明书
编码小袁7 小时前
探索数据科学与大数据技术专业本科生的广阔就业前景
大数据
WeeJot嵌入式8 小时前
大数据治理:确保数据的可持续性和价值
大数据