简述Elasticsearch(ES)是什么全文搜索概念 (倒排索引管理文档)

今天我们来说说 NoSql 中的 Elasticsearch 大家基本都叫它 ES

官方介绍它是一个分布式全文搜索引擎

分布式是一个系统架构的概念

而全文搜索引擎

全文搜索可以说基本大家天天都在接触就比如

我们京东购物想买什么东西在全文输入框中搜索它就会在所有物品中帮你找出需要的

它会将所有的数据进行一个分类然后在你输入时将与你输入内容想匹配的数据都推送出来

但还有一个分类的概念

比如我们只是靠name 搜索用户搜索的 spring

那么下图中 1 2 3 4都没有问题但第五本书显然会被过滤掉因为它的name 不包含内容

但是按照逻辑讲他和 spring有关系它应该要出现所以我们不能只按name查询

而我们查询 spring 实战那么它们也该出来只要能匹配上的不管内容是否能完全一样都要出来

这就是全文搜搜而 ES 就是一个全文搜索的解决方案

全文搜索思路是将某个内容分词

例如 Spring实战第5版

那么词就会被拆分为

Spring

实战

第5版

当然也不能乱拆就比如我每个字母每一个字符都拆

那用户输入什么都带出来一大片没有意义的数据

我们我们通过关键字分组

例如我们输入 Spring 为搜索关键字那么就会带出 1 2 3 4 5条数据的数据id与部分字段内容

实战为关键字就会带出第1条数据的 id与部分内容字段

di5版也是会带出第一条数据的 id和部分字段数据

就比如进洞我们搜素电动他就会带出很多关于电动物品的信息

但是这里每条数据都只是带出了一部分信息

当我们点击某个进去查看详情它其实是将你点的数据 id拿到然后根据id再去查询详情

因为有些字段外面展示本来就不需要呀就比如这个视频外面用过图片就好了进来了再加载视频这种很大的东西要不然匹配出一百个商品还加载一百个视频吗？

那么就是说全文搜索我们先要对提供的数据进行分词将一个文本分词若干个关键字

然后通过这些关键字帮助用户匹配出符合要求的数据

这种方式会大大提高搜索效率

还有就是索引的概念我们传统索引是根据id查数据

而这里我们是根据数据得到id 这个过程叫倒排索引然后再用id获取数据用传统索引都OK

然后就是我们为了更好的管理需要提前建立关系每个关键字对应某些数据部分内容与id的数据关系被我们称作文档

例如 Spring 关键字对应 1 2 3 4 5 条数据的 id与部分字段这个对应关系就是一个文档

创建无数个文档存入这样就会方便使用

然后就是根据关键字使用文档

简述Elasticsearch(ES)是什么 全文搜索概念 (倒排索引 管理文档)