简述Elasticsearch(ES)是什么 全文搜索概念 (倒排索引 管理文档)

今天 我们来说说 NoSql 中的 Elasticsearch 大家基本都叫它 ES

官方介绍 它是一个分布式全文搜索引擎

分布式是一个系统架构的概念

而 全文搜索引擎

全文搜索 可以说基本大家天天都在接触 就比如

我们京东购物 想买什么东西 在全文输入框中搜索 它就会在所有物品中 帮你找出需要的

它会将 所有的数据进行一个分类 然后 在你输入时 将与你输入内容想匹配的数据都推送出来

但 还有一个分类的概念

比如 我们只是靠name 搜索 用户搜索的 spring

那么 下图中 1 2 3 4都没有问题 但第五本书显然会被过滤掉 因为它的name 不包含内容

但是按照逻辑讲 他和 spring有关系 它应该要出现 所以 我们不能只按name查询

而 我们查询 spring 实战 那么 它们也该出来 只要能匹配上的 不管内容是否能完全一样 都要出来

这就是 全文搜搜 而 ES 就是一个全文搜索的解决方案

全文搜索 思路是 将某个内容分词

例如 Spring实战 第5版

那么 词就会被拆分为

Spring

实战

第5版

当然 也不能乱拆 就比如 我每个字母 每一个字符都拆

那用户输入什么都带出来一大片没有意义的数据

我们 我们通过关键字分组

例如 我们输入 Spring 为搜索关键字 那么 就会带出 1 2 3 4 5条数据的 数据id与部分字段内容

实战为关键字 就会带出 第1条数据的 id与部分内容字段

di5版也是 会带出第一条数据的 id和部分字段数据

就比如 进洞 我们搜素电动 他就会带出 很多关于电动物品的信息

但是 这里 每条数据都只是带出了一部分信息

当我们点击某个进去 查看详情 它其实是将你点的数据 id拿到 然后根据id再去查询详情

因为有些字段 外面展示本来就不需要呀 就比如这个视频 外面用过图片就好了 进来了再加载视频这种很大的东西 要不然 匹配出 一百个商品 还加载 一百个视频吗?

那么 就是说 全文搜索 我们先要对提供的数据进行分词 将一个文本 分词若干个关键字

然后 通过这些关键字 帮助用户匹配出符合要求的数据

这种方式 会大大提高搜索效率

还有就是 索引的概念 我们传统索引是根据id查数据

而这里 我们是根据数据得到id 这个过程叫倒排索引 然后再用id获取数据 用传统索引都OK

然后就是 我们为了更好的管理 需要提前建立关系 每个关键字 对应 某些数据 部分内容与id的数据关系 被我们称作文档

例如 Spring 关键字 对应 1 2 3 4 5 条数据的 id与部分字段 这个对应关系 就是一个文档

创建无数个文档 存入 这样就会方便使用

然后就是 根据关键字 使用文档

相关推荐
TDengine (老段)7 小时前
从施工监测到运营预警,桥科院用 TDengine 提升桥梁数据管理能力
大数据·数据库·物联网·时序数据库·tdengine·涛思数据
宁波鹿语心理7 小时前
无条件的在场:一项极简亲子依恋修复练习的机制分析与实证观察
大数据
二哈赛车手12 小时前
新人笔记---ES和kibana启动问题以及一些常用的linux的错误排查方法,以及ES,数据库泄密解决方案[超详细]
java·linux·数据库·spring boot·笔记·elasticsearch
lizhihai_9914 小时前
股市学习心得—半导体12种核心材料
大数据·人工智能·学习
ZGi.ai14 小时前
智能客服系统设计:从工单分类到自动派单的工程实现
大数据·人工智能·分类
PaperData14 小时前
2000-2023年地级市数字基础设施评价指标体系
大数据·网络·数据库·人工智能·数据分析·经管
Blockchain Learning15 小时前
去中心化身份(DID)模型解析:区块链如何重塑身份管理?
大数据·去中心化·区块链
xcbrand15 小时前
政府事业机构品牌策划公司哪家可靠
大数据·人工智能·python
程序鉴定师15 小时前
如何选择合适的深圳小程序开发公司?
大数据·小程序
晨启AI16 小时前
GPT-5.5 来了!OpenAI 最新提示词指南深度解读
大数据·人工智能·ai·提示词