ES前置定义和描述

目录

介绍说明

基于Apache Lucene构建的开源分布式搜索和分析引擎,专为处理大规模数据而设计。

java语言开发的web项目

全文检索

定义 :一种非结构化数据 的搜索方式
结构化数据 :固定长度固定格式,比如数据库中的字段
非结构化数据 :格式长度不固定,比如电商网站商品详情(包含文字,图片等)
搜索方式:全文检索通过建立倒排索引加快搜索效率

倒排索引

索引 :提取出一部分数据信息,并组成一定的数据结构,使得用户可通过此结构进行搜索。
正排索引 :以数据库中的主键建立正排索引
倒排索引 :在非结构化数据中,根据数据中的关键词建立索引,并建立指向文档。

倒排索引创建流程

ES和Solr的对比

特性 Solr Elasticsearch
分布式管理 利用Zookeeper进行分布式管理 自身带有分布式协调管理功能
数据格式支持 支持更多格式的数据 仅支持json文件格式
功能提供 官方提供的功能更多 本身更注重于核心功能,高级功能多由第三方插件提供
搜索应用表现 在传统的搜索应用中表现好于Elasticsearch 在处理实时搜索应用时效率明显高于Solr
市场占有率 - 越来越高,受到更多公司的青睐
Spring支持 Spring Data Solr曾受支持 Spring从2020年起停止Spring Data Solr的维护,转向Elasticsearch

数据结构(存储非结构化数据)

7.0之前有type后续,8.0则完全移除type这个概念。

JAVA项目 Elasticsearch (ES) MySQL
实体类(Entity Class) 索引(Index)* 表(Table)
对象(Object) 文档(Document) 行(Row)
属性(Attribute/Field) 字段(Field) 列(Column)
相关推荐
成长之路51437 分钟前
【数据集】A股上市公司深度合成算法业务数据(2001-2024)
大数据
GIS数据转换器3 小时前
延凡智慧水务系统:引领行业变革的智能引擎
大数据·人工智能·无人机·智慧城市
2601_949539453 小时前
家用新能源 SUV 核心技术科普:后排娱乐、空间工程与混动可靠性解析
大数据·网络·人工智能·算法·机器学习
莫叫石榴姐4 小时前
字节广告数开一面 | 实习
大数据·数据仓库·面试
T06205144 小时前
【面板数据】地级市人力资本水平测算数据(1990-2024年)
大数据
TDengine (老段)5 小时前
TDengine IDMP 可视化 —— 饼图
大数据·数据库·人工智能·物联网·时序数据库·tdengine·涛思数据
Flying pigs~~5 小时前
从“踩坑”到“可控”:大模型 Prompt 工程实战总结与进阶方法论
大数据·人工智能·大模型·prompt·提示词工程
白眼黑刺猬6 小时前
实时库存预警: 如何实现秒级更新且保证在高并发下不出现“超卖”显示错误?
大数据·面试·职场和发展
云栖梦泽6 小时前
【AI】AI安全工具:常用AI安全检测工具的使用教程
大数据·人工智能·安全
智慧化智能化数字化方案6 小时前
咨询进阶——毕马威-高科技行业基于平衡计分卡的绩效管理方法研讨【附全文阅读】
大数据·绩效管理·人力资源管理·力资源管控体系·企业人力资源数字化转·绩效考核指标范例