ES前置定义和描述

目录

介绍说明

基于Apache Lucene构建的开源分布式搜索和分析引擎,专为处理大规模数据而设计。

java语言开发的web项目

全文检索

定义 :一种非结构化数据 的搜索方式
结构化数据 :固定长度固定格式,比如数据库中的字段
非结构化数据 :格式长度不固定,比如电商网站商品详情(包含文字,图片等)
搜索方式:全文检索通过建立倒排索引加快搜索效率

倒排索引

索引 :提取出一部分数据信息,并组成一定的数据结构,使得用户可通过此结构进行搜索。
正排索引 :以数据库中的主键建立正排索引
倒排索引 :在非结构化数据中,根据数据中的关键词建立索引,并建立指向文档。

倒排索引创建流程

ES和Solr的对比

特性 Solr Elasticsearch
分布式管理 利用Zookeeper进行分布式管理 自身带有分布式协调管理功能
数据格式支持 支持更多格式的数据 仅支持json文件格式
功能提供 官方提供的功能更多 本身更注重于核心功能,高级功能多由第三方插件提供
搜索应用表现 在传统的搜索应用中表现好于Elasticsearch 在处理实时搜索应用时效率明显高于Solr
市场占有率 - 越来越高,受到更多公司的青睐
Spring支持 Spring Data Solr曾受支持 Spring从2020年起停止Spring Data Solr的维护,转向Elasticsearch

数据结构(存储非结构化数据)

7.0之前有type后续,8.0则完全移除type这个概念。

JAVA项目 Elasticsearch (ES) MySQL
实体类(Entity Class) 索引(Index)* 表(Table)
对象(Object) 文档(Document) 行(Row)
属性(Attribute/Field) 字段(Field) 列(Column)
相关推荐
志栋智能1 小时前
告别高昂投入:超自动化IT运维的轻量化实践
大数据·运维·网络·人工智能·自动化
腾视科技TENSORTEC1 小时前
腾视科技TS-SG-SM7系列AI算力模组:32TOPS算力引擎,开启边缘智能新纪元
大数据·人工智能·科技·ai·ai算力模组·ai模组·ainas
大黄说说2 小时前
微信小程序制作平台有哪些?
大数据
黎阳之光2 小时前
AI数智筑防线 绿色科技启新篇——黎阳之光硬核技术赋能生态安全双升级
大数据·人工智能·算法·安全·数字孪生
九硕智慧建筑一体化厂家2 小时前
碳综合管控系统是什么?企业全链路能碳管理的核心载体
大数据
无心水2 小时前
时间处理工程落地指南:数据库/日志/API/定时任务
java·大数据·数据库·日志·分布式架构·utc·gmt
紧固视界2 小时前
不锈钢标准件有哪些?种类与用途详解_6月上海紧固件展
大数据·物联网·上海紧固件展·紧固件展·上海紧固件专业展
ApacheSeaTunnel3 小时前
从 Apache SeaTunnel 走向 ASF Member:一位开发者的长期主义样本
大数据·开源·数据集成·seatunnel·数据同步
Lalolander3 小时前
工厂工艺管理进阶:SMT生产阶别如何实现精细化管控?
大数据·制造·mes·制造执行系统·工厂管理系统·工厂生产进度管理·工厂工单管理
黎阳之光4 小时前
黎阳之光:数智技术赋能水利“平急两用” 筑牢水利工程安全防线
大数据·人工智能·算法·安全·数字孪生