分布式搜索ElasticSearch-ES（一）

一、ElasticSearch介绍

ES是一款非常强大的开源搜索引擎，可以帮我们从海量的数据中快速找到我们需要的内容。

ElasticSearch结合kibana、Logstash、Beats，也就是elastic stack(ELK)，被广泛运用在日志数据分析，实时监控等领域。

ES负责数据 存储、计算、搜索数据。

LogStash和Beats负责 数据抓取。

Kibana 是数据可视化组件。

Lucence是ES的底层开发，java语言搜索引擎类库，是Apache公司顶级项目。

Lucence优势：

缺点：

于是在lucence的基础上，ES优点：

什么是ElasticSearch？

一个开源的分布式搜索引擎，可以实现日志搜索，日志统计，分析等。

什么是ElasticSearch Stack(ELK)？

是以es为核心，logStash和beats负责数据抓取，kibana数据可视化的技术栈。

二、索引

传统数据库采用正向索引，而es采用倒排索引。

如mysql采用正向索引，比如一个表里有id，这个自增id就属于主键索引，也属于正向索引，查询非常快。

但如果查询某个字段，这个字段叫title其中存储着"明朝那些事"，这时候如果想查包含"那些"的title怎么查询呢，即使title有索引，这时候用模糊查询也会索引失效。

ElasticSearch采用倒排索引，倒排索引有两个概念，文档和词条。

词条的唯一性保证不会重复，对词条创建索引。

查询"华为手机"的过程：

为什么叫倒排索引呢，因为平时数据库我们是先通过id去找具体的值，而es的倒排索引我们通过次创建新的索引，所以先是去找值再找对应索引的具体值。

三、ES与mysql对比

文档：

ElasticSearch是面向文档存储，可以是数据库一条商品或者一个订单信息。会被序列化成JSON格式存储。

索引（index）：

会把类型相同的索引放在一起，比如商品索引，用户索引，订单索引等。

索引就是文档的集合，类似与数据库的表。

Document是json风格，row是一条条数据。

Mysql擅长事务，数据库一致性和安全。

Es擅长海量数据搜索和计算。