【Elasticsearch】 Compound Queries

Elasticsearch Compound Queries

Elasticsearch 的 Compound Queries 是一种强大的工具,用于组合多个查询子句,以实现更复杂的搜索逻辑。这些查询子句可以是叶查询(Leaf Queries)或复合查询(Compound Queries),并且可以用于组合结果和分数、改变行为或从查询上下文切换到过滤上下文。

主要的复合查询类型

  1. bool 查询

    • 用于组合多个叶查询或复合查询子句,支持 mustshouldmust_notfilter 子句。mustshould 子句的分数会被合并,而 must_notfilter 子句在过滤上下文中执行。

    JSON复制

    复制代码
    GET /products/_search
    {
      "query": {
        "bool": {
          "must": [
            { "match": { "description": "wireless headphones" } }
          ],
          "filter": [
            { "term": { "brand": "BrandA" } }
          ],
          "should": [
            { "range": { "price": { "lte": 100 } } }
          ],
          "must_not": [
            { "term": { "color": "red" } }
          ]
        }
      }
    }
  2. boosting 查询

    • 返回匹配 positive 查询的文档,但会降低也匹配 negative 查询的文档的分数。

    JSON复制

    复制代码
    {
      "query": {
        "boosting": {
          "positive": { "match": { "content": "multiple queries" }},
          "negative": { "term": { "status": "archived" }},
          "negative_boost": 0.5
        }
      }
    }
  3. constant_score 查询

    • 包装另一个查询,但在过滤上下文中执行它。所有匹配的文档都将获得相同的"常量" _score
  4. dis_max 查询

    • 接受多个查询,并返回匹配任何查询子句的文档。与 bool 查询合并所有匹配查询的分数不同,dis_max 查询使用单个最佳匹配查询子句的分数。

    JSON复制

    复制代码
    {
      "query": {
        "dis_max": {
          "queries": [
            { "match": { "name": "kimchy" }},
            { "match": { "name": "elasticsearch" }}
          ],
          "boost": 1.2,
          "tie_breaker": 0.7
        }
      }
    }
  5. function_score 查询

    • 使用函数修改主查询返回的分数,考虑因素如流行度、最近性、距离或通过脚本实现的自定义算法。

    JSON复制

    复制代码
    {
      "query": {
        "function_score": {
          "query": { "match": { "name": "kimchy" }},
          "functions": [
            { "random_score": { "seed": 1234 }},
            { "exponential_decay": { "field": "age", "origin": 0, "scale": 1 }}
          ],
          "score_mode": "multiply"
        }
      }
    }

使用场景

  • 组合多个条件 :使用 bool 查询组合多个搜索条件,例如同时匹配多个字段。

  • 调整查询权重 :使用 boosting 查询调整某些文档的权重。

  • 固定分数 :使用 constant_score 查询为所有匹配文档分配固定分数。

  • 选择最佳匹配 :使用 dis_max 查询选择最佳匹配的查询子句。

  • 自定义评分 :使用 function_score 查询根据自定义逻辑调整文档分数。

通过合理使用这些复合查询,您可以构建更复杂、更灵活的搜索逻辑,以满足不同的业务需求。

相关推荐
AI数据皮皮侠5 小时前
中国各省森林覆盖率等数据(2000-2023年)
大数据·人工智能·python·深度学习·机器学习
大有数据可视化9 小时前
数字孪生背后的大数据技术:时序数据库为何是关键?
大数据·数据库·人工智能
山河亦问安10 小时前
基于Kafka+ElasticSearch+MongoDB+Redis+XXL-Job日志分析系统(学习)
mongodb·elasticsearch·kafka
Elastic 中国社区官方博客10 小时前
CI/CD 流水线与 agentic AI:如何创建自我纠正的 monorepos
大数据·运维·数据库·人工智能·搜索引擎·ci/cd·全文检索
计算机毕设残哥15 小时前
基于Hadoop+Spark的商店购物趋势分析与可视化系统技术实现
大数据·hadoop·python·scrapy·spark·django·dash
IT研究室15 小时前
大数据毕业设计选题推荐-基于大数据的全球能源消耗量数据分析与可视化系统-大数据-Spark-Hadoop-Bigdata
大数据·hadoop·spark·毕业设计·源码·数据可视化·bigdata
武子康15 小时前
大数据-113 Flink 源算子详解:非并行源(Non-Parallel Source)的原理与应用场景
大数据·后端·flink
禁默17 小时前
第四届云计算、大数据应用与软件工程国际学术会议(CBASE 2025)
大数据·云计算
Elasticsearch18 小时前
Elasticsearch MCP 服务器:与你的 Index 聊天
elasticsearch
Lansonli18 小时前
大数据Spark(六十五):Transformation转换算子groupByKey和filter
大数据·分布式·spark