【DevOps】怎么提升Elasticsearch 的搜索性能

提升 Elasticsearch (ES) 的搜索性能可以从多个角度进行优化，包括硬件选择、配置调整、查询优化等。以下是一些具体的方法和建议：

使用 SSDs： 使用固态硬盘（SSD）而非机械硬盘（HDD），因为 SSD 在随机读写和低延迟方面表现更好。
增加内存： 增加服务器的内存可以让更多的数据保留在内存中，减少磁盘 I/O 操作。Elasticsearch heavily relies on the operating system's filesystem cache, so more RAM can improve performance.
合理的 CPU 配置： 确保有足够的 CPU 资源来处理查询和索引操作。虽然 ES 是 I/O 密集型的，但在高并发查询时，CPU 也会成为瓶颈。

合理设置 index.refresh_interval： 默认为 1s。对于写入密集型应用，可以适当增加这个值；对于读密集型，应保持较低。
使用 doc_values： 对于聚合、排序等操作，确保字段是 doc_values 启用的，这样可以减少内存使用并提高性能。
调整堆内存（Heap Size）： 堆内存不宜过大也不宜过小，一般建议设置为物理内存的 50%，但不超过 32GB（因为 JVM 会使用压缩指针）。
索引分片和副本： 合理设置索引的分片（shards）和副本（replicas）数量。分片过多或过少都会影响性能。副本数可以根据读取压力调整以提高读取性能。

避免使用高基数字段进行聚合： 高基数字段（字段中唯一值非常多的字段）进行聚合会消耗大量资源。
使用合适的字段类型： 比如，使用 keyword 类型而非 text 类型进行精确匹配查询。
禁用 _all 字段： 如果不需要，可以在映射中禁用 _all 字段来节省空间和提高索引效率。
使用 index_options 和 norms： 对于不需要全文搜索的字段，可以在映射中设置 index_options 为 docs，并禁用 norms。

利用 filter context： 对于不需要计分的查询，使用 filter context（如 bool/filter），这样可以利用缓存，提高查询效率。
避免深分页： 使用 search_after 或游标（scroll/cursor）来替代深分页，因为深分页会随着分页深度的增加而变得非常慢。
使用 bool 查询优化： 尽量使用 bool 查询合并多个查询条件，而不是多次单独查询。
预计算重复查询： 对于重复的、不经常变化的查询结果，可以考虑预计算和缓存结果。

使用 Elasticsearch 监控工具： 如 Elastic Stack 的 X-Pack、Elasticsearch-head、Kibana 的 Monitoring 功能来监控集群状态和性能。
定期查看慢查询日志： 分析并优化慢查询，找出性能瓶颈。

根据您的具体使用场景（如文本搜索、日志分析、数据聚合等），优化策略会有所不同。理解并监控您的具体负载是制定有效优化策略的关键。

在 Elasticsearch 中，查看当前的分片数可以通过多种方式实现，包括使用 Elasticsearch 的 REST API、Kibana Dev Tools 或者其他管理工具。以下是几种常用的方法来查看索引的分片信息：

要查看集群中所有索引的分片配置，可以使用 _cat/indices API 并添加 v 参数使输出更易于阅读。例如：

复制代码

curl -X GET "http://localhost:9200/_cat/indices?v"

这个命令会列出所有索引及其相关信息，包括每个索引的分片数（pri 表示主分片数，rep 表示每个主分片的副本数）。

如果你只对某个特定索引的分片信息感兴趣，可以使用 _settings API 来获取详细信息。如下所示：

复制代码

curl -X GET "http://localhost:9200/<index_name>/_settings?pretty"

这里 <index_name> 替换为你的索引名。这个请求将返回该索引的设置信息，包括分片数。输出中 "number_of_shards" 和 "number_of_replicas" 分别表示主分片数和副本分片数。

如果你使用 Kibana，可以通过 Kibana 的 Dev Tools 来执行上述 API 调用。

或者查看特定索引的分片数：

复制代码

GET /<index_name>/_settings

这里 <index_name> 是你想查看的索引名称。

你还可以查看集群的整体分片状态，包括每个分片是主分片还是副本分片，以及它们的健康状态等信息：

复制代码

curl -X GET "http://localhost:9200/_cat/shards?v"

或在 Kibana Dev Tools 中：

复制代码

GET /_cat/shards?v

这将列出所有分片的详细信息。

如果你安装了 Elasticsearch-head 插件或其他类似的 Elasticsearch 管理和监控插件，你可以通过这些插件的 GUI 查看分片信息。这通常包括：

根据你的需求，选择合适的方法来查看分片信息。这些信息有助于你评估当前的 Elasticsearch 设置，并进一步优化配置。