Elasticsearch 的模糊查询相关概念

舒一笑2025-07-16 11:32

1. 前缀搜索（prefix）

小白理解 ：

就是查"以某个词开头"的内容，比如你搜"app"，能搜到"apple"、"application"等。

只看词（term）是不是以你给的前缀开头，不管是不是完整的字段。
性能不太好，速度慢，最好前缀长一点。
没有缓存，查询多了也不会变快。

2. 通配符（wildcard）

小白理解 ：

就是查"带有某种模式"的内容，比如"a*e"能搜到"apple"、"ace"等。

* 代表任意多个字符，? 代表一个字符。
也是对词（term）做匹配，不是对整个字段。

3. 正则（regexp）

小白理解 ：

就是用正则表达式查内容，比如"a.*e"能搜到"apple"、"ace"、"abcde"等。

正则表达式可以很灵活，但复杂的正则会很慢。
有些特殊功能（如区间、否定、交集等）可以通过 flags 开启。

4. 模糊查询（fuzzy）

小白理解 ：

就是查"拼写差不多"的内容，比如你输错了"applr"，也能搜到"apple"。

能容忍拼写错误、缺字、多字、顺序颠倒等。
可以设置"模糊度"，越大越宽松，但结果可能不准。

5. 短语前缀（match_phrase_prefix）

小白理解 ：

就是查"以某个短语开头"的内容，比如"this is ma"能搜到"this is man"、"this is magic"。

会先分词，然后最后一个词用前缀匹配。
适合输入一半的短语时做自动补全。

6. N-gram 和 edge ngram

小白理解 ：

这是一种把词拆成很多小片段（子串）的技术，方便做模糊和前缀搜索。

ngram ：从每个字符都开始拆，比如"abc"会拆成"a"、"ab"、"abc"、"b"、"bc"、"c"。
- 适合"中间模糊"检索，比如"abc"能搜到"b"。
edge_ngram ：只从第一个字符开始拆，比如"abc"会拆成"a"、"ab"、"abc"。
- 适合"前缀"检索，比如"abc"能搜到"a"、"ab"。

总结表

查询类型	适用场景	小白理解举例
prefix	前缀匹配	"app"搜"apple"
wildcard	模糊匹配	"a*e"搜"apple"
regexp	正则灵活匹配	"a.*e"搜"apple"
fuzzy	拼写错误容忍	"applr"搜"apple"
match_phrase_prefix	短语前缀补全	"this is ma"搜"this is man"
ngram	任意位置模糊	"b"搜"abc"
edge_ngram	前缀模糊	"ab"搜"abc"

上一篇：区块链：以太坊侧链Polygon

下一篇：GPIO 输入/输出

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03如何新建文件夹？电脑新建文件夹的4种方法 04AI科技热点日报 | 2026年07月01日 05幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）072026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？08AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 092026 年 AI 大模型 & AI 编程工具实战全总结 10Kimi K3 真实体验：全网评价整理，优缺点一次性说清楚