2024-01-25(ElasticSearch)

附上:ElasticSearch从入门到精通,史上最全(持续更新,未完待续,每天一点点)_elasticsearch从入门到精通,史上最全-CSDN博客

1.ES中存储不是重要的,搜索查询功能才是ES的核心

2.ES提供了基于JSON的DSL(Domain Specific Language)来定义查询。

常见的查询类型:查询所有,全文索引,精确查询,地理查询,复合查询。

3.精确查询的值是不可分割的整体,所以可以采用精确查询来做。

4.ES是分布式的,并且会将数据切分开的存储到不同的服务器上。所以ES会面临深度分页问题。

5.ES还可以把搜索结果高亮显示。例如百度搜索Java,Java关键字会红色显示。

原理:服务端将搜索结果中的关键字用标签标记出来,然后在页面中给标签添加CSS样式。

6.ES中的数据聚合:

聚合可以实现对文档数据的统计,分析,运算,聚合常见有三类:

桶聚合:用来对文档做分组

度量聚合:用来计算一些值,比如最大值,最小值,平均值等

管道聚合:其他聚合的结果为基础做聚合

7.技术都是根据需求来的,业务场景的使用推动技术的发展。业务高于技术。技术为业务服务。

8.ES中的分词器,包含三个部分:

character filters:在tokenizer之前对文本进行处理。例如删除字符,替换字符

tokenizer:将文本按照一定的规则切割成词条。

tokenizer filter:将tokenizer输出的词条做进一步处理。例如大小写转换,同义词处理,拼音处理等。

9.ES实现自动补全功能的查询

自动补全对字段的要求:类型是completion类型,字段值是多词条的数组

10.ES && MySQL 对比:

ES中的index索引库就类似于MySQL中的数据库。

ES中的Type类型就类似于MySQL中对于表的定义。

ES中的document文档就是最终存储数据的地方,类似于MySQL中表的一条数据。

ES中的Field字段类似于MySQL中的列的概念。

ES中的shard分片:一台服务器,无法存储大量的数据,ES把一个index里面的数据,分为多个shard,分布式的存储在各个服务器上面。

相关推荐
闻道参看15 小时前
2026企业GEO选型指南:主流AI优化服务商对比
大数据·人工智能
Elastic 中国社区官方博客15 小时前
13.7万人,零人工决策:使用 Elasticsearch 实现智能体驱动的灾害响应系统
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
明航咨询—张老师15 小时前
AI工具狂飙时代:三款实用AI产品深度横向测评
大数据·人工智能·算法·it
二等饼干~za89866815 小时前
2026 主流 GEO 优化源码厂商横向测评:云罗 GEO / 摘星智能 / 棋引科技技术、部署、性价比全维度对比
大数据·人工智能·科技
志栋智能15 小时前
超自动化巡检:在混合云时代更显其必要性
大数据·运维·网络·人工智能·自动化
招标采购导航网16 小时前
招标采购导航网的召回通道设计:为什么同时用协同过滤、向量召回、规则召回三种策略
大数据·人工智能
可乐ea16 小时前
【知识获取与分享社区项目 | 项目日记第 19 天】基于 Elasticsearch 实现关键词检索与业务权重排序
java·大数据·spring boot·mysql·elasticsearch·搜索引擎·全文检索
金融Tech趋势派17 小时前
2026企业微信SCRM与获客系统选型指南:功能矩阵、场景适配与避坑清单
大数据·人工智能·企业微信
宸津-代码粉碎机18 小时前
Spring AI企业级Agent实战|多工具自动规划+并行调度落地,彻底解决复杂业务AI任务编排问题
java·大数据·人工智能·spring boot·python·spring
TDengine (老段)18 小时前
TDengine 数据修复与迁移 — VGroup 调度、S3 外挂与运维操作
大数据·运维·数据库·物联网·时序数据库·iot·tdengine