【Elasticsearch】 Compound Queries

Elasticsearch Compound Queries

Elasticsearch 的 Compound Queries 是一种强大的工具,用于组合多个查询子句,以实现更复杂的搜索逻辑。这些查询子句可以是叶查询(Leaf Queries)或复合查询(Compound Queries),并且可以用于组合结果和分数、改变行为或从查询上下文切换到过滤上下文。

主要的复合查询类型

  1. bool 查询

    • 用于组合多个叶查询或复合查询子句,支持 mustshouldmust_notfilter 子句。mustshould 子句的分数会被合并,而 must_notfilter 子句在过滤上下文中执行。

    JSON复制

    复制代码
    GET /products/_search
    {
      "query": {
        "bool": {
          "must": [
            { "match": { "description": "wireless headphones" } }
          ],
          "filter": [
            { "term": { "brand": "BrandA" } }
          ],
          "should": [
            { "range": { "price": { "lte": 100 } } }
          ],
          "must_not": [
            { "term": { "color": "red" } }
          ]
        }
      }
    }
  2. boosting 查询

    • 返回匹配 positive 查询的文档,但会降低也匹配 negative 查询的文档的分数。

    JSON复制

    复制代码
    {
      "query": {
        "boosting": {
          "positive": { "match": { "content": "multiple queries" }},
          "negative": { "term": { "status": "archived" }},
          "negative_boost": 0.5
        }
      }
    }
  3. constant_score 查询

    • 包装另一个查询,但在过滤上下文中执行它。所有匹配的文档都将获得相同的"常量" _score
  4. dis_max 查询

    • 接受多个查询,并返回匹配任何查询子句的文档。与 bool 查询合并所有匹配查询的分数不同,dis_max 查询使用单个最佳匹配查询子句的分数。

    JSON复制

    复制代码
    {
      "query": {
        "dis_max": {
          "queries": [
            { "match": { "name": "kimchy" }},
            { "match": { "name": "elasticsearch" }}
          ],
          "boost": 1.2,
          "tie_breaker": 0.7
        }
      }
    }
  5. function_score 查询

    • 使用函数修改主查询返回的分数,考虑因素如流行度、最近性、距离或通过脚本实现的自定义算法。

    JSON复制

    复制代码
    {
      "query": {
        "function_score": {
          "query": { "match": { "name": "kimchy" }},
          "functions": [
            { "random_score": { "seed": 1234 }},
            { "exponential_decay": { "field": "age", "origin": 0, "scale": 1 }}
          ],
          "score_mode": "multiply"
        }
      }
    }

使用场景

  • 组合多个条件 :使用 bool 查询组合多个搜索条件,例如同时匹配多个字段。

  • 调整查询权重 :使用 boosting 查询调整某些文档的权重。

  • 固定分数 :使用 constant_score 查询为所有匹配文档分配固定分数。

  • 选择最佳匹配 :使用 dis_max 查询选择最佳匹配的查询子句。

  • 自定义评分 :使用 function_score 查询根据自定义逻辑调整文档分数。

通过合理使用这些复合查询,您可以构建更复杂、更灵活的搜索逻辑,以满足不同的业务需求。

相关推荐
信创天地5 分钟前
核心系统去 “O” 攻坚:信创数据库迁移的双轨运行与数据一致性保障方案
java·大数据·数据库·金融·架构·政务
それども8 分钟前
ES KQL 支持词频统计吗
elasticsearch
zhyf11915 分钟前
Max395(ubuntu24.04)AMD显卡GLM-4.7-UD-IQ1-M量化模型部署手册
大数据·elasticsearch·搜索引擎
小北方城市网21 分钟前
微服务接口设计实战指南:高可用、易维护的接口设计原则与规范
java·大数据·运维·python·微服务·fastapi·数据库架构
武子康1 小时前
大数据-210 如何在Scikit-Learn中实现逻辑回归及正则化详解(L1与L2)
大数据·后端·机器学习
xiaobaishuoAI1 小时前
全链路性能优化实战指南:从瓶颈定位到极致优化
大数据·人工智能·科技·百度·geo
乾元1 小时前
如何把 CCIE / HCIE 的实验案例改造成 AI 驱动的工程项目——从“实验室能力”到“可交付系统”的完整迁移路径
大数据·运维·网络·人工智能·深度学习·安全·机器学习
xiaobaishuoAI1 小时前
后端工程化实战指南:从规范到自动化,打造高效协作体系
java·大数据·运维·人工智能·maven·devops·geo
俊哥大数据1 小时前
【实战项目5】基于Flink新闻热搜大数据实时分析项目
大数据·flink
俊哥大数据1 小时前
【实战项目3】基于Flink广告投放业务领域大数据实时分析项目
大数据·flink