学习es可以参考mysql(相比mysql而言,es所需的cpu、内存更多)
什么是Elasticsearch
Elasticsearch简称es,是由Elastic和search组成。Elastic的意思是有弹性的,search的意思是搜索。
弹性:es是一个天生支持分布式,不需要借助zk等其他的三方组件就能实现的分布式,理论上讲可以无限进行扩容
搜索: es是一个搜索引擎。(和mysql的搜索区分开)。es是一个由java开发的,借助qpi提供服务
mysql是关系型数据库,每个表中的一些字段都有关联,数据库三大范式。所以mysql更适合做业务相关的关联查询。而es是非关系型数据库,更擅长做搜索
es的擅长和不擅长
es擅长从海量数据中检索少量相关数据,你不擅长单次查询大量数据。es同样也不擅长事务。最起码大于2000万才用es(mysql官方表面mysql的瓶颈为2000万条数据)
es适合做大数据处理
es的实时性
es是一个olap系统。,侧重于海量数据的检索,而写入实时性并不是很高。默认是1秒。es在存数据时,并不会马上就写入磁盘,而是先放在buffer维冲区, es并不是忽路了这个性能,而是有意为之。原因就是es是一个搜索引擎,写入的实时性和大数据的检索性能是一个二选一的行为,实际上我们有很多时候,都是通过牺牲写入实时性来换取性能。(牺牲空间来换取时间)
es有多快
在官方文档里描述,1PB的数据,秒级相应。1PB=1024TB=1024*1024GB
什么时候适合用es
当数据量足够大,比如说淘宝有上亿的商品,为了保证搜索性能。淘宝订单:淘宝一年的订单量,也是上百亿
es是一个基于文档的搜索引擎。模糊搜索可以搜出来且搜的多的结果排序自动提高优先级,下次查询的时候优先显示
es还适合存一些日志信息、操作日志、聊天弹幕、评论、订单、商品等只要生成就不变的
es常用概念
索引:可以简单理解为mysql中的表
文档:可以简单理解为表里的一行数据(es会搜索出来几个文档)
es索引创建的时候就是把所有的想要查询的信息都放到一个索引里面(es从8.2.0开始建议都所有字段用String)