分布式搜索引擎-elasticsearch基础

elasticsearch是一款非常强大的开源搜索引擎，可以帮助我们从海量数据中快速找到需要的内容。
elasticsearch结合kibana、Logstash、Beats，也就是elastic stack（ELK）。被广泛应用在日志数据分析 、实时监控等领域。
elasticsearch是elastic stack的核心，负责存储、搜索、分析数据。

Lucene 是一个Java语言的搜索引擎类库 ，是Apache公司的顶级项目，由DougCutting于1999年研发。官网地址：https://lucene.apache.org/。

Lucene的优势：

Lucene的缺点：

基于Lucene开发，也就是elasticsearch的底层实现

相比与lucene，elasticsearch具备下列优势：

搜索引擎技术排名：

传统数据库（如MySQL）采用正向索引，所以相对比之后给出的elasticsearch 是倒排索引。

正向索引图示：

倒排索引：

elasticsearch会新建一张表来记录根据语义划分的词条，然后检索词条，然后查询文档。

搜索流程：

如下图：

MySQL	Elasticsearch	说明
Table	Index	索引(index)，就是文档的集合，类似数据库的表(table)
Row	Document	文档（Document），就是一条条的数据，类似数据库中的行（Row），文档都是JSON格式
Column	Field	字段（Field），就是JSON文档中的字段，类似数据库中的列（Column）
Schema	Mapping	Mapping（映射）是索引中文档的约束，例如字段类型约束。类似数据库的表结构（Schema）
SQL	DSL	DSL是elasticsearch提供的JSON风格的请求语句，用来操作elasticsearch，实现CRUD

Mysql ：擅长事务类型操作，可以确保数据的安全和一致性

Elasticsearch ：擅长海量数据的搜索、分析、计算

图解：