ES前置定义和描述

目录

介绍说明

基于Apache Lucene构建的开源分布式搜索和分析引擎,专为处理大规模数据而设计。

java语言开发的web项目

全文检索

定义 :一种非结构化数据 的搜索方式
结构化数据 :固定长度固定格式,比如数据库中的字段
非结构化数据 :格式长度不固定,比如电商网站商品详情(包含文字,图片等)
搜索方式:全文检索通过建立倒排索引加快搜索效率

倒排索引

索引 :提取出一部分数据信息,并组成一定的数据结构,使得用户可通过此结构进行搜索。
正排索引 :以数据库中的主键建立正排索引
倒排索引 :在非结构化数据中,根据数据中的关键词建立索引,并建立指向文档。

倒排索引创建流程

ES和Solr的对比

特性 Solr Elasticsearch
分布式管理 利用Zookeeper进行分布式管理 自身带有分布式协调管理功能
数据格式支持 支持更多格式的数据 仅支持json文件格式
功能提供 官方提供的功能更多 本身更注重于核心功能,高级功能多由第三方插件提供
搜索应用表现 在传统的搜索应用中表现好于Elasticsearch 在处理实时搜索应用时效率明显高于Solr
市场占有率 - 越来越高,受到更多公司的青睐
Spring支持 Spring Data Solr曾受支持 Spring从2020年起停止Spring Data Solr的维护,转向Elasticsearch

数据结构(存储非结构化数据)

7.0之前有type后续,8.0则完全移除type这个概念。

JAVA项目 Elasticsearch (ES) MySQL
实体类(Entity Class) 索引(Index)* 表(Table)
对象(Object) 文档(Document) 行(Row)
属性(Attribute/Field) 字段(Field) 列(Column)
相关推荐
宸津-代码粉碎机6 分钟前
Spring Boot 4.0虚拟线程实战续更预告:高阶技巧、监控排查与分布式场景落地指南
java·大数据·spring boot·分布式·后端·python
黎阳之光6 分钟前
黎阳之光受邀出席上海口岸联合会2026智慧口岸研讨班 无感通关方案获盛赞
大数据·人工智能·算法·安全·数字孪生
GlobalInfo7 分钟前
全球汽车音频数字信号处理器市场规模、企业排名、市场占有率及前景分析报告(2026-2032)
大数据·汽车·音视频
Irene199110 分钟前
大数据开发场景中,Python 常用且易错易混淆的知识点总结(附:从实战角度梳理的 Python 知识体系)
大数据·python
JZC_xiaozhong10 分钟前
2026技术深潜:解构Spring Boot与Spring Framework架构,透视KPaaS集成平台底层逻辑
大数据·spring boot·spring·架构·数据集成与应用集成·异构系统集成·应用对接
8Qi815 分钟前
Elasticsearch实战篇:索引库、文档与JavaRestClient操作指南
java·大数据·elasticsearch·搜索引擎·微服务·架构·springcloud
米猴设计师15 分钟前
PS电商详情页高效制作:Nano Banana一键生成电商高转化套图(附实操教程)
大数据·图像处理·人工智能·ai·aigc·startai·banana修图
PNP Robotics16 分钟前
集智联机器人(PNP)亮相第三届中国具身智能大会,以“双臂+遥操作“多维方案定义具身交互新范式
大数据·人工智能·python·深度学习·机器人
Rubin智造社2 小时前
04月17日AI每日参考:Claude Opus 4.7正式发布,智元机器人大会今日开幕
大数据·人工智能·机器学习·claude code·智元机器人·deepseek v4·claude opus 4.7
Alex艾力的IT数字空间8 小时前
在 Kylin(麒麟)操作系统上搭建 Docker 环境
大数据·运维·缓存·docker·容器·负载均衡·kylin