【Elasticsearch】 Compound Queries

Elasticsearch Compound Queries

Elasticsearch 的 Compound Queries 是一种强大的工具,用于组合多个查询子句,以实现更复杂的搜索逻辑。这些查询子句可以是叶查询(Leaf Queries)或复合查询(Compound Queries),并且可以用于组合结果和分数、改变行为或从查询上下文切换到过滤上下文。

主要的复合查询类型

  1. bool 查询

    • 用于组合多个叶查询或复合查询子句,支持 mustshouldmust_notfilter 子句。mustshould 子句的分数会被合并,而 must_notfilter 子句在过滤上下文中执行。

    JSON复制

    复制代码
    GET /products/_search
    {
      "query": {
        "bool": {
          "must": [
            { "match": { "description": "wireless headphones" } }
          ],
          "filter": [
            { "term": { "brand": "BrandA" } }
          ],
          "should": [
            { "range": { "price": { "lte": 100 } } }
          ],
          "must_not": [
            { "term": { "color": "red" } }
          ]
        }
      }
    }
  2. boosting 查询

    • 返回匹配 positive 查询的文档,但会降低也匹配 negative 查询的文档的分数。

    JSON复制

    复制代码
    {
      "query": {
        "boosting": {
          "positive": { "match": { "content": "multiple queries" }},
          "negative": { "term": { "status": "archived" }},
          "negative_boost": 0.5
        }
      }
    }
  3. constant_score 查询

    • 包装另一个查询,但在过滤上下文中执行它。所有匹配的文档都将获得相同的"常量" _score
  4. dis_max 查询

    • 接受多个查询,并返回匹配任何查询子句的文档。与 bool 查询合并所有匹配查询的分数不同,dis_max 查询使用单个最佳匹配查询子句的分数。

    JSON复制

    复制代码
    {
      "query": {
        "dis_max": {
          "queries": [
            { "match": { "name": "kimchy" }},
            { "match": { "name": "elasticsearch" }}
          ],
          "boost": 1.2,
          "tie_breaker": 0.7
        }
      }
    }
  5. function_score 查询

    • 使用函数修改主查询返回的分数,考虑因素如流行度、最近性、距离或通过脚本实现的自定义算法。

    JSON复制

    复制代码
    {
      "query": {
        "function_score": {
          "query": { "match": { "name": "kimchy" }},
          "functions": [
            { "random_score": { "seed": 1234 }},
            { "exponential_decay": { "field": "age", "origin": 0, "scale": 1 }}
          ],
          "score_mode": "multiply"
        }
      }
    }

使用场景

  • 组合多个条件 :使用 bool 查询组合多个搜索条件,例如同时匹配多个字段。

  • 调整查询权重 :使用 boosting 查询调整某些文档的权重。

  • 固定分数 :使用 constant_score 查询为所有匹配文档分配固定分数。

  • 选择最佳匹配 :使用 dis_max 查询选择最佳匹配的查询子句。

  • 自定义评分 :使用 function_score 查询根据自定义逻辑调整文档分数。

通过合理使用这些复合查询,您可以构建更复杂、更灵活的搜索逻辑,以满足不同的业务需求。

相关推荐
Project_Observer10 分钟前
为您的项目选择最合适的Zoho Projects自动化巧能
大数据·运维·人工智能·深度学习·机器学习·自动化·编辑器
RD_daoyi25 分钟前
新手小白独立站运营实操手册:从0到1跑通流量-转化-留存闭环
搜索引擎
IT观测30 分钟前
选高低温环境试验箱,品牌、生产商、厂家哪个维度更可靠?
大数据·人工智能
isNotNullX32 分钟前
BI如何落地?BI平台如何搭建?
大数据·数据库·人工智能
k8s容器运维大佬41 分钟前
‌原油拉升、黄金白银走低,通常利好能源与工业板块,利空贵金属与部分成长型科技股‌。
大数据·人工智能
talen_hx2962 小时前
《零基础入门Spark》学习笔记 Day 14
大数据·笔记·学习·spark
老纪的技术唠嗑局2 小时前
告别OpenClaw配置丢失——Mindkeeper内测版邀测
大数据·elasticsearch·搜索引擎
老陈头聊SEO2 小时前
高效整合长尾关键词以提升网站SEO排名的有效策略
其他·搜索引擎·seo优化
2501_933329552 小时前
技术深度剖析:Infoseek 字节探索舆情处置系统的全链路架构与核心实现
大数据·数据仓库·人工智能·自然语言处理·架构