ElasticSearch_学习笔记

一、初始elasticsearch

  1. 什么是elasticsearch?
    一个开源的分布式搜索引擎,可以用来时限搜素、日志统计、分析、系统监控等功能。
  2. 什么是elasitc stack(ELK)?
    是以elasticsearch为核心的技术栈,包括 beats、Logstash、kibana、slasticsearch。
  3. 什么是Lucene?
    是Apache的开源搜索引擎类库,提供了索索引擎的核心API。

正向索引和倒排索引

什么是文档和词条?

每一条数据就是一个文档

对文档中的内容分词,得到的词语就是词条。
什么是正向索引?

基于文档id创建索引。查询词条时必须先找到文档,然后判断是否包含词条。
什么是倒排索引?

对文档内容分词,对词条创建索引,并记录词条所在文档的信息。查询时先根据词条查询到文档id,而后获取到文档。

相关概念

文档

elasticsearch是面向文档存储的,可以是数据库中的一条商品数据,一个订单信息。

文档数据会被序列化为json格式后存储在elasticsearch中。
索引(Index)

索引: 相同类型文档的集合。

映射(mapping):索引中文档的字段约束信息,类似表的结构约束、

与mysql的区别

Mysql: 擅长事务类型操作,可以确保数据的安全和一致性。

Elasticsearch: 擅长海量数据的搜索、分析、计算。

安装elasticsearch、kibana

分词器的作用

创建倒排索引时对文档分词

用户搜索时,对输入的内容分词。

IK分词器有集中模式

ik_smart: 智能切分,粗粒度

ik_max_word: 最细切分,细粒度

IK 分词器如何拓展词条?如何停用词条?

利用config目录的IkAnalyzer.cfg.xml文件添加拓展词典和停用词典。

在词典中添加拓展词条或者停用词条。

文档操作有哪些?

创建文档:POST/ 索引库名 /_doc/ 文档id {json文档}

查询文档 : GET/索引库名/ _doc /文档id

删除文档 : DELETE / 索引库名 / _doc / 文档id

修改文档:

  • 全量修改: PUT / 索引库名 / _doc /文档id {json文档}
  • 增量修改: POST/索引库名 /_update/ 文档id {"doc":{字段}}

RestClient 操作索引库

  • 初始化ResthighLevelClient
  • 创建XxxIndexRequest。XXX是 create、get、delete
  • 准备DSL (create时需要)
  • 发送请求。调用ResthighlevelClient # indices().xxx()方法,xxx是create、exists、delete。

文档化操作

  • 初始化ResthighLevelClient
  • 创建XxxRequest。XXX是Index、get、undate、delete。
  • 准备呢参数(Index和Update时需要)。
  • 发送请求。调用RestHighLevelClient#.xxx()方法,xxx是index、get、update、delete。
  • 解析结果(get时需要)。

查询DSL的基本语法

GET /索引库名/_search

{"query":{"查询类型":{"FIELD":"TEXT"}}}

json 复制代码
GET /索引库名/_search
{"query":{"查询类型":{"FIELD":"TEXT"}}}

match 和multi_match的区别

  • match:根据一个字段查询
  • multi_match:根据多个字段查询,参与查询字段越多,查询性能越差。
相关推荐
程序员大金12 分钟前
基于SpringBoot+Vue+MySQL的在线学习交流平台
java·vue.js·spring boot·后端·学习·mysql·intellij-idea
码到成龚17 分钟前
《数字图像处理基础》学习01-数字图像处理的相关基础知识
学习
程序员小李_1 小时前
心理——《在绝望中寻找希望:俞敏洪写给迷茫不安的年轻人》
学习
向上的车轮1 小时前
Django学习笔记四:urls配置详解
笔记·学习·django
小白黑_2161 小时前
设计模式笔记
笔记·设计模式
新手unity自用笔记2 小时前
项目-坦克大战学习笔记-按键按下控制方向
笔记·学习·c#
调了个寂寞2 小时前
INS风格时尚自拍人像摄影后期Lr调色,手机滤镜PS+Lightroom预设下载!
笔记
瞌睡不来2 小时前
(刷题记录5)盛最多水的容器
c++·笔记·学习·题目记录
一 乐2 小时前
考研论坛平台|考研论坛小程序系统|基于java和微信小程序的考研论坛平台小程序设计与实现(源码+数据库+文档)
java·数据库·学习·考研·微信·小程序·源码
大G哥3 小时前
ELK日志收集之ES的DSL查询语句
大数据·elk·elasticsearch·搜索引擎·jenkins