Elasticsearch 查询时 term、match、match_phrase、match_phrase_prefix 的区别

Elasticsearch 查询时 term、match、match_phrase、match_phrase_prefix 的区别

  • [keyword 与 text 区别](#keyword 与 text 区别)
  • [term 查询](#term 查询)
  • [match 查询](#match 查询)
  • [match_phrase 查询](#match_phrase 查询)
  • [match_phrase_prefix 查询](#match_phrase_prefix 查询)
  • 写在最后

在讲述 es 查询时 term、match、match_phrase、match_phrase_prefix 的区别之前,先来了解一下 es 文本字段类型 keyword、 text 的区别。

keyword 与 text 区别

在 es 创建索引中,经常会遇到 keyword 、text 字段类型的选择,其实他们之间的区别也比较容易理解。

keyword:在索引时,keyword类型的数据不会被分词器处理,而是直接作为整体存储到索引中。

text:在索引时,text类型的数据会经过分词器处理,将文本切分成多个词条,然后存储到索引中。

可以通过以下命令来查看分词结果,es 不指定分词器则走的是 es 默认的分词器(通常情况下都是单字)

查看 text 字段类型分词结果

复制代码
POST /_analyze
{
  "text": "很高兴为您服务"
}

查看 keyword 字段类型分词结果

复制代码
POST /_analyze
{
  "analyzer": "keyword", 
  "text": "很高兴为您服务"
}

term 查询

term 查询用于精确值匹配,它不会对查询的文本进行分词处理,直接在索引中查找精确值。

适用场景:适用于关键字(keyword)类型的字段,或者已经过精确值(如数字、日期等)处理的文本字段。这里我用 term 查询来精确查询 convId属性字段

复制代码
GET crm_meiqia_conversation_tmp/_search
{  
  "query": {  
    "bool": {  
      "must": [  
        {
          "term" : {
              "convId" : 6305271104
            }
        } 
      ]
    }  
  }  
}

查询结果如图

match 查询

match 查询是一种全文搜索查询,它会对查询文本进行分词处理,然后搜索分词后的结果。它适用于 text 类型的字段。

适用场景:用于执行全文搜索,适合于搜索文本内容。这里我搜索一下索引中的 text 类型字段 ,由于表数据比较多,因此上一次查询的 convId 字段我还保留。

复制代码
GET crm_meiqia_conversation_tmp/_search
{  
  "query": {  
    "bool": {  
      "must": [  
        {
          "term" : {
              "convId" : 6305271104
            }
        } ,
        {  
          "match": {  
            "convContent.content": "哦 一下 保存 "  
          }  
        }
      ]
    }  
  }  
}

查询结果如图

match_phrase 查询

match_phrase 查询是一种精确短语匹配查询,它会在文本中查找包含指定短语的文档,同时考虑短语的顺序和位置。

适用场景:适用于需要精确匹配短语的场景,如引用搜索、精确短语匹配等。比如这里我们还查询上面的一段话,查看一下查询结果,顺序不对的话应是查询不到结果的

复制代码
GET crm_meiqia_conversation_tmp/_search
{  
  "query": {  
    "bool": {  
      "must": [  
        {
          "term" : {
              "convId" : 6305271104
            }
        } ,
        {  
          "match_phrase": {  
            "convContent.content": "哦 一下 保存 "  
          }  
        }
      ]
    }  
  }  
}

查询结果如图

这时候我调整一下查询内容的顺序后再次尝试,就可以查询到数据

复制代码
GET crm_meiqia_conversation_tmp/_search
{  
  "query": {  
    "bool": {  
      "must": [  
        {
          "term" : {
              "convId" : 6305271104
            }
        } ,
        {  
          "match_phrase": {  
            "convContent.content": "保存 一下 "  
          }  
        }
      ]
    }  
  }  
}

查询结果如图

match_phrase_prefix 查询

match_phrase_prefix 查询是 match_phrase 查询的一个变种,它允许对查询短语的最后一个单词进行前缀匹配。

适用场景:适用于需要匹配以特定前缀开头的短语且对查询精度要求较高的场景。这里查询要求前缀匹配,类似于 mysql 的 like 查询 的 "保存%"

复制代码
GET crm_meiqia_conversation_tmp/_search
{  
  "query": {  
    "bool": {  
      "must": [  
        {
          "term" : {
              "convId" : 6305271104
            }
        } ,
        {  
          "match_phrase_prefix": {  
            "convContent.content": "保存 一下 "  
          }  
        }
      ]
    }  
  }  
}

查询结果如图

更换一下顺序,就无法通过前缀匹配到内容了,比如

复制代码
GET crm_meiqia_conversation_tmp/_search
{  
  "query": {  
    "bool": {  
      "must": [  
        {
          "term" : {
              "convId" : 6305271104
            }
        } ,
        {  
          "match_phrase_prefix": {  
            "convContent.content": "一下 保存"  
          }  
        }
      ]
    }  
  }  
}

查询结果如图

写在最后

以上就是 Elasticsearch 查询时 term、match、match_phrase、match_phrase_prefix 的区别,大家根据具体适用的场景选择合适的查询语句哈。

相关推荐
DataX_ruby8225 分钟前
2026年数据中台厂商市场份额分析
大数据·人工智能·数据治理·数据中台
汉知宝科技1 小时前
跨境电商品牌合规:出海企业商标管理的特殊挑战与数字化应对
大数据·人工智能
真上帝的左手1 小时前
19. 大数据-数据治理-体系建设全流程
大数据·数据治理
❀抽抽2 小时前
证件照制作API接入指南:700+规格一键生成
大数据·网络·人工智能
Promise微笑2 小时前
绝缘油介损(油介损)测试仪的深层机理、技术演进与精准诊断策略
大数据·网络·人工智能
大C聊AI2 小时前
通用大模型纷纷收费,垂直场景AI工具的价值正在被重估
大数据·人工智能·机器学习·办公效率·ai 工具·智标领航·ai 辅助办公
让学习成为一种生活方式3 小时前
植物基因组数据共享:呼吁全面开放获取--文献精读244
大数据
Java 码思客3 小时前
【ElasticSearch从入门到架构师】第5章:ES DSL 检索语法精讲(核心重点)
大数据·elasticsearch
lauo3 小时前
ibbot青春版:当腾讯AI“换船”,一部手机如何成为你的Token“私矿”?
大数据·人工智能·chatgpt·智能手机·ai-native
老虾头3 小时前
合规化背景下,本地私有 AI 成为行业主流发展方向
大数据·人工智能