前言
为什么学ElasticSearch?
数据一般有如下三种类型:
- 结构化数据,如:MySQL的表,一般通过索引提高查询效率
- 非结构化数据,如:图片、音频等不能用表结构表示的数据,一般保存到mongodb、redis、hbase等非关系型数据库,通过key-value查询
- 半结构化数据,如:json、xml文件,一般保存到mongodb、redis、hbase等非关系型数据库,通过key-value查询
对于结构化数据而言,字段不容易扩展,且有些数据是非结构化的,如:日志,为了提高查询效率,可以使用ElasticSearch
一、快速入门
1.1 Elasticsearch 介绍
Elaticsearch,简称为 ES, 是一个开源的高扩展的分布式全文搜索引擎, 是整个 ElasticStack 技术栈的核心。
全文搜索引擎:类似谷歌、百度、博客文章、还有日志的搜索,它们是根据网页的关键字生成索引,我们输入关键字时就会匹配到所有网页并返回,而对于非结构化的数据文本,关系型数据库不能很好的支持。
The Elastic Stack, 包括 Elasticsearch、 Kibana、 Beats 和 Logstash(也称为 ELK Stack),能够安全可靠地获取任何来源、任何格式的数据,然后实时地对数据进行搜索、分析和可视化。
它可以近乎实时的存储、检索数据;本身扩展性很好,可以扩展到上百台服务器,处理 PB 级别的数据。
1.2 安装环境(以win10为例)
官方网址:https://www.elastic.co/cn/downloads/?elektra=home\&storm=hero
elasticsearch新增数据
bash
curl -X POST "http://localhost:9200/自定义索引名称/_doc/自定义文档id" -H 'Content-Type: application/json' -d'
{
"field1": "value1",
"field2": "value2"
}
'
查询数据
bash
curl -X GET "http://localhost:9200/自定义索引名称/_doc/自定义文档id"
批量插入数据
bash
curl -X POST "http://localhost:9200/_bulk?pretty" -H "Content-Type: application/json;charset=UTF-8" -d '
{"index":{"_index": "website", "_id":"1" }}
{"title1" : "My updated blog post"}
{"index":{"_index": "website", "_id":"2" }}
{"title2" : "My updated blog post123"}
'
Elasticsearch命令(curl)大全