ES前置定义和描述

目录

介绍说明

基于Apache Lucene构建的开源分布式搜索和分析引擎,专为处理大规模数据而设计。

java语言开发的web项目

全文检索

定义 :一种非结构化数据 的搜索方式
结构化数据 :固定长度固定格式,比如数据库中的字段
非结构化数据 :格式长度不固定,比如电商网站商品详情(包含文字,图片等)
搜索方式:全文检索通过建立倒排索引加快搜索效率

倒排索引

索引 :提取出一部分数据信息,并组成一定的数据结构,使得用户可通过此结构进行搜索。
正排索引 :以数据库中的主键建立正排索引
倒排索引 :在非结构化数据中,根据数据中的关键词建立索引,并建立指向文档。

倒排索引创建流程

ES和Solr的对比

特性 Solr Elasticsearch
分布式管理 利用Zookeeper进行分布式管理 自身带有分布式协调管理功能
数据格式支持 支持更多格式的数据 仅支持json文件格式
功能提供 官方提供的功能更多 本身更注重于核心功能,高级功能多由第三方插件提供
搜索应用表现 在传统的搜索应用中表现好于Elasticsearch 在处理实时搜索应用时效率明显高于Solr
市场占有率 - 越来越高,受到更多公司的青睐
Spring支持 Spring Data Solr曾受支持 Spring从2020年起停止Spring Data Solr的维护,转向Elasticsearch

数据结构(存储非结构化数据)

7.0之前有type后续,8.0则完全移除type这个概念。

JAVA项目 Elasticsearch (ES) MySQL
实体类(Entity Class) 索引(Index)* 表(Table)
对象(Object) 文档(Document) 行(Row)
属性(Attribute/Field) 字段(Field) 列(Column)
相关推荐
财经资讯数据_灵砚智能4 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年6月14日
大数据·人工智能·python·ai·信息可视化·自然语言处理·灵砚智能
Justice Young4 小时前
Flink第六章:flink中的时间和窗口
大数据·flink
xingyuzhisuan5 小时前
算力租赁平台 GPU 资源隔离方案:显存抢占问题深度排查与解决
大数据·云计算·gpu算力
天天讯通6 小时前
OKCC 呼叫中心安全性能全解析:技术防护与管理措施指南
大数据·开发语言·网络·人工智能·安全·语音识别
名不经传的养虾人7 小时前
从0到1:企业级AI项目迭代日记 Vol.47|从“能说”到“能上手”
大数据·人工智能·ai编程·企业ai·多agent协作
MicroTech20258 小时前
业绩披露|微算法科技(MLGO)2025年净利润1.27亿元
大数据·人工智能·科技
AGIPlayer8 小时前
没有生态的大模型不算前沿
大数据·人工智能·物联网
weilaieqi18 小时前
际连集团:印尼公司注册代办一站式服务
大数据
林间码客8 小时前
04 ROC曲线与AUC:从零开始手动计算
大数据·人工智能·算法
穆利堂-movno19 小时前
住宅、写字楼、高校、医院物业后勤数字化升级:“收费+巡检+工单”全链路落地思路
大数据