Elasticsearch 的模糊查询相关概念

1. 前缀搜索(prefix)

小白理解

就是查"以某个词开头"的内容,比如你搜"app",能搜到"apple"、"application"等。

  • 只看词(term)是不是以你给的前缀开头,不管是不是完整的字段。
  • 性能不太好,速度慢,最好前缀长一点。
  • 没有缓存,查询多了也不会变快。

2. 通配符(wildcard)

小白理解

就是查"带有某种模式"的内容,比如"a*e"能搜到"apple"、"ace"等。

  • * 代表任意多个字符,? 代表一个字符。
  • 也是对词(term)做匹配,不是对整个字段。

3. 正则(regexp)

小白理解

就是用正则表达式查内容,比如"a.*e"能搜到"apple"、"ace"、"abcde"等。

  • 正则表达式可以很灵活,但复杂的正则会很慢。
  • 有些特殊功能(如区间、否定、交集等)可以通过 flags 开启。

4. 模糊查询(fuzzy)

小白理解

就是查"拼写差不多"的内容,比如你输错了"applr",也能搜到"apple"。

  • 能容忍拼写错误、缺字、多字、顺序颠倒等。
  • 可以设置"模糊度",越大越宽松,但结果可能不准。

5. 短语前缀(match_phrase_prefix)

小白理解

就是查"以某个短语开头"的内容,比如"this is ma"能搜到"this is man"、"this is magic"。

  • 会先分词,然后最后一个词用前缀匹配。
  • 适合输入一半的短语时做自动补全。

6. N-gram 和 edge ngram

小白理解

这是一种把词拆成很多小片段(子串)的技术,方便做模糊和前缀搜索。

  • ngram :从每个字符都开始拆,比如"abc"会拆成"a"、"ab"、"abc"、"b"、"bc"、"c"。
    • 适合"中间模糊"检索,比如"abc"能搜到"b"。
  • edge_ngram :只从第一个字符开始拆,比如"abc"会拆成"a"、"ab"、"abc"。
    • 适合"前缀"检索,比如"abc"能搜到"a"、"ab"。

总结表

查询类型 适用场景 小白理解举例
prefix 前缀匹配 "app"搜"apple"
wildcard 模糊匹配 "a*e"搜"apple"
regexp 正则灵活匹配 "a.*e"搜"apple"
fuzzy 拼写错误容忍 "applr"搜"apple"
match_phrase_prefix 短语前缀补全 "this is ma"搜"this is man"
ngram 任意位置模糊 "b"搜"abc"
edge_ngram 前缀模糊 "ab"搜"abc"

相关推荐
AAA修煤气灶刘哥9 小时前
MySQL 查文本查哭了?来唠唠 ES 这货:从 “啥是 ES” 到 Java 撸代码,一篇整明白!
java·后端·elasticsearch
Elasticsearch13 小时前
什么是上下文工程 (Context Engineering)?
elasticsearch
白毛大侠15 小时前
如何安全地删除与重建 Elasticsearch 的 .watches 索引
大数据·elasticsearch·jenkins
Elastic 中国社区官方博客15 小时前
Elasticsearch 的 JVM 基础知识:指标、内存和监控
java·大数据·elasticsearch·搜索引擎·全文检索
Arthurmoo16 小时前
Git常用命令大全:高效开发必备
大数据·elasticsearch·搜索引擎
华农第一蒟蒻1 天前
Elasticsearch赋能3D打印机任务统计分析
java·大数据·spring boot·后端·elasticsearch·adb·maven
Elasticsearch1 天前
转变数据交互:在 Amazon Bedrock AgentCore Runtime 上部署 Elastic 的 MCP 服务器以构建 agentic AI 应用
elasticsearch
赤月幼狼1 天前
elasticsearch学习(五)文档CRUD
学习·elasticsearch
在未来等你2 天前
Elasticsearch面试精讲 Day 8:聚合分析与统计查询
大数据·分布式·elasticsearch·搜索引擎·面试
知彼解己2 天前
Elasticsearch 核心知识与常见问题解析
大数据·elasticsearch·搜索引擎