ElasticSearch-全文检索(一)基本介绍

简介Elasticsearch:官方分布式搜索和分析引擎 | Elastic

全文搜索属于最常见的需求,开源的Elasticsearch是目前全文搜索引擎的首选。 它可以快速地储存、搜索和分析海量数据。维基百科、StackOverflow、Github都采用它

Elastic的底层是开源库Lucene。但是,你没法直接用Lucene,必须自己写代码去调用它的 接口。Elastic是Lucene的封装,提供了RESTAPI的操作接口,开箱即用。 RESTAPI:天然的跨平台。

然而,Elasticsearch 不仅仅是 Lucene,并且也不仅仅只是一个全文搜索引擎。 它可以被下面这样准确的形容:

  • 一个分布式的实时文档存储,每个字段 可以被索引与搜索
  • 一个分布式实时分析搜索引擎
  • 能胜任上百个服务节点的扩展,并支持 PB 级别的结构化或者非结构化数据

官方文档:https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html

官方中文:https://www.elastic.co/guide/cn/elasticsearch/guide/current/foreword_id.html

社区中文: https://es.xiaoleilu.com/index.html http://doc.codingdict.com/elasticsearch/0

一、基本概念

1、Index(索引)

动词,相当于MySQL中的insert;

名词,相当于MySQL中的Database

2、Type(类型)

在Index(索引)中,可以定义一个或多个类型。

类似于MySQL中的Table;每一种类型的数据放在一起;

3、Document(文档)

保存在某个索引(Index)下,某种类型(Type)的一个数据(Document),文档是JSON格 式的,Document就像是MySQL中的某个Table里面的内容

4、倒排索引机制

相关推荐
计算机编程小央姐1 小时前
【Spark+Hive+hadoop】基于spark+hadoop基于大数据的人口普查收入数据分析与可视化系统
大数据·hadoop·数据挖掘·数据分析·spark·课程设计
鲲志说2 小时前
数据洪流时代,如何挑选一款面向未来的时序数据库?IoTDB 的答案
大数据·数据库·apache·时序数据库·iotdb
没有bug.的程序员2 小时前
MVCC(多版本并发控制):InnoDB 高并发的核心技术
java·大数据·数据库·mysql·mvcc
nju_spy4 小时前
南京大学 - 复杂结构数据挖掘(一)
大数据·人工智能·机器学习·数据挖掘·数据清洗·南京大学·相似性分析
哈哈很哈哈5 小时前
Flink SlotSharingGroup 机制详解
java·大数据·flink
豆豆豆大王5 小时前
头歌Kingbase ES内连接、外连接查询
大数据·数据库·elasticsearch
龙茶清欢6 小时前
7、revision 是 Maven 3.5+ 引入的现代版本管理机制
java·elasticsearch·maven
know__ledge6 小时前
Pytest+requests进行接口自动化测试6.0(Jenkins)
elasticsearch·jenkins·pytest
在未来等你6 小时前
Elasticsearch面试精讲 Day 20:集群监控与性能评估
大数据·分布式·elasticsearch·搜索引擎·面试
是店小二呀8 小时前
整合亮数据Bright Data与Dify构建自动化分析系统
大数据·自动化·dify·mcp·bright data