ES Filter Query 区别

Elasticsearch(ES) 中,FilterQuery 是两种常用的数据检索方式,它们的主要区别在于 是否计算相关性分数(Score) 以及 是否使用缓存。以下是它们的详细区别和应用场景:


1. 核心区别

特性 Filter(过滤器) Query(查询)
相关性分数 不计算分数,只判断文档是否匹配。 计算分数,用于衡量文档与查询的相关性。
性能 性能更高,适合精确匹配。 性能较低,适合全文检索。
缓存 结果会被缓存,重复查询时更快。 结果不会被缓存。
使用场景 精确匹配(如范围查询、Term 查询)。 全文检索(如 Match 查询)。
排序 不参与排序。 参与排序(基于分数)。

2. 详细说明

(1)Filter(过滤器)

  • 特点

    • 只判断文档是否匹配,不计算相关性分数。

    • 结果会被缓存,适合重复查询的场景。

    • 性能更高,因为不需要计算分数。

  • 使用场景

    • 精确匹配(如 Term 查询、Range 查询)。

    • 布尔条件判断(如 mustshouldmust_not)。

    • 过滤不需要排序的数据。

  • 示例

    json

    复制

    复制代码
    {
      "query": {
        "bool": {
          "filter": [
            { "term": { "status": "active" } },
            { "range": { "age": { "gte": 18, "lte": 30 } } }
          ]
        }
      }
    }

(2)Query(查询)

  • 特点

    • 计算文档与查询的相关性分数(Score)。

    • 结果不会被缓存。

    • 适合全文检索和模糊匹配。

  • 使用场景

    • 全文检索(如 Match 查询)。

    • 需要排序的场景(基于分数)。

    • 模糊匹配(如 Fuzzy 查询)。

  • 示例

    json

    复制

    复制代码
    {
      "query": {
        "match": {
          "title": "elasticsearch"
        }
      }
    }

3. Filter 和 Query 的结合使用

在实际应用中,Filter 和 Query 通常会结合使用,以兼顾性能和相关性。例如:

  • 使用 Filter 过滤掉不符合条件的文档。

  • 使用 Query 对剩余文档计算相关性分数。

示例:

json

复制

复制代码
{
  "query": {
    "bool": {
      "must": [
        { "match": { "title": "elasticsearch" } }  // Query
      ],
      "filter": [
        { "term": { "status": "active" } },       // Filter
        { "range": { "age": { "gte": 18 } } }     // Filter
      ]
    }
  }
}
  • must:用于 Query,计算相关性分数。

  • filter:用于 Filter,不计算分数,但会缓存结果。


4. 性能对比

  • Filter

    • 性能更高,适合精确匹配。

    • 结果缓存可以显著提升重复查询的性能。

  • Query

    • 性能较低,因为需要计算相关性分数。

    • 适合全文检索和排序场景。


5. 总结

  • Filter

    • 适合精确匹配和过滤场景。

    • 不计算分数,性能更高,结果会被缓存。

  • Query

    • 适合全文检索和排序场景。

    • 计算分数,性能较低,结果不会被缓存。

  • 结合使用

    • 在实际应用中,通常将 Filter 和 Query 结合使用,以兼顾性能和相关性。

通过合理使用 Filter 和 Query,可以显著提升 Elasticsearch 的查询性能和准确性。

相关推荐
Elasticsearch1 天前
在 ES|QL 中的混合搜索和多阶段检索
elasticsearch
AC赳赳老秦1 天前
量化交易脚本开发:DeepSeek生成技术指标计算与信号触发代码
数据库·elasticsearch·信息可视化·流程图·数据库架构·memcached·deepseek
Elastic 中国社区官方博客1 天前
使用 Elastic Agent Builder 和 MCP 实现 Agentic 参考架构
大数据·人工智能·elasticsearch·搜索引擎·ai·架构·全文检索
予枫的编程笔记1 天前
Elasticsearch深度搜索与查询DSL实战:精准定位数据的核心技法
java·大数据·人工智能·elasticsearch·搜索引擎·全文检索
予枫的编程笔记1 天前
Elasticsearch聚合分析与大规模数据处理:解锁超越搜索的进阶能力
java·大数据·人工智能·分布式·后端·elasticsearch·全文检索
我是海飞1 天前
Git 本地仓库推送到远程空仓库指南
大数据·git·elasticsearch
better_liang1 天前
每日Java面试场景题知识点之-ELK技术栈实战应用
java·elk·elasticsearch·kibana·logstash·日志分析·企业级应用
予枫的编程笔记1 天前
Elasticsearch核心架构与基础原理:解密其极速性能的底层逻辑
java·大数据·人工智能·elasticsearch·搜索引擎·架构·全文检索
长路 ㅤ   2 天前
ES索引切分方案4:索引+别名 应用层自己维护:时间序列索引
elasticsearch·索引模板·时间序列索引·别名系统·大数据优化
小龙2 天前
【Git 报错解决】本地分支与远程分支名称/提交历史不匹配
大数据·git·elasticsearch·github