Elasticsearch

Elasticsearch

Elasticsearch 是一个基于 Lucene 的分布式搜索引擎,具备高效的全文搜索、实时数据分析和数据可视化等功能。它采用倒排索引的方式来存储和搜索数据,能够快速响应用户的搜索请求,并支持水平扩展。

倒排索引

倒排索引(或者反向索引)是一种存储单词在文档或一组文档中的位置的索引方法,常用于全文搜索。

在没有搜索引擎时,我们是直接输入一个网址,然后获取网站内容,这时我们的行为是:

document -> to -> words

通过文章,获取里面的单词,此谓「正向索引」,forward index.

后来,我们希望能够输入一个单词,找到含有这个单词,或者和这个单词有关系的文章:

word -> to -> documents

于是我们把这种索引,成为inverted index,直译过来,应该叫「反向索引」,国内翻译成「倒排索引」。

为什么快

  1. 使用倒排索引:倒排索引是一种针对文本搜索而优化的数据结构,它将每个词与出现这个词的文档列表关联起来,这样就可以快速查找包含某些词的文档。

  2. 分布式:它将索引分成若干个分片,并在多台机器上进行分布式存储,这样就可以并行处理查询,提升查询效率。

怎么和数据库数据保证一致性

使用数据库监测工具canal监测数据库数据库数据变化,将变化数据的消息投递到MQ中,然后通过MQ异步更新ES中的数据。

学习ES博客推荐

https://blog.csdn.net/Andrew_Chenwq/article/details/128722692

相关推荐
未来之窗软件服务3 分钟前
平台对接(2)美团/抖音/饿了么/有赞/微信/京东券核销服务商模式—东方仙盟
大数据·运维·微信·平台对接·仙盟创梦ide·东方仙盟·东方仙盟sdk
2501_944934736 分钟前
大专信息统计与分析专业,怎么提升Excel高级函数的使用能力?
大数据·excel
康康的AI博客11 分钟前
AI模型压缩与优化:如何通过蒸馏提升模型的运行效率
大数据·人工智能
藦卡机器人19 分钟前
国产包装机器人品牌推荐
大数据·人工智能·机器人
TDengine (老段)23 分钟前
TDengine IDMP 基本概念
大数据·数据库·物联网·ai·时序数据库·tdengine·涛思数据
莫叫石榴姐30 分钟前
海豚调度器DataX任务执行失败(退出码127)解决方案(软链接版)
大数据·github
Loqate地址智能31 分钟前
机器学习如何破解全球欺诈工业化?实时检测+设备智能识别,反欺诈技术实操方案
大数据·人工智能·安全·机器学习
骥龙36 分钟前
第八篇:成效篇 - 数字说话:平台上线一年的ROI分析
大数据·人工智能·机器学习
IPDEEP全球代理38 分钟前
TikTok多账号运营?使用静态IP还是动态IP合适?
大数据·网络协议·tcp/ip
CSDN搜索1 小时前
基于Elasticsearch构建高性能技术社区搜索
大数据·elasticsearch·搜索引擎