Elasticsearch 面试题

文章目录

    • [Elasticsearch 读取数据](#Elasticsearch 读取数据)
    • [您能解释一下 X-Pack for Elasticsearch 的功能和重要性吗?](#您能解释一下 X-Pack for Elasticsearch 的功能和重要性吗?)
    • [Elasticsearch 中的节点(比如共 20 个),其中的 10 个选了 一个master,另外 10 个选了另一个 master,怎么办?](#Elasticsearch 中的节点(比如共 20 个),其中的 10 个选了 一个master,另外 10 个选了另一个 master,怎么办?)
    • [解释一下 Elasticsearch 集群中的索引的概念 ?](#解释一下 Elasticsearch 集群中的索引的概念 ?)
    • [你可以列出 Elasticsearch 各种类型的分析器吗?](#你可以列出 Elasticsearch 各种类型的分析器吗?)
    • [解释一下 Elasticsearch Node?](#解释一下 Elasticsearch Node?)
    • [在安装 Elasticsearch 时,请说明不同的软件包及其重要性?](#在安装 Elasticsearch 时,请说明不同的软件包及其重要性?)
    • [Elasticsearch 在部署时,对 Linux 的设置有哪些优化方法?](#Elasticsearch 在部署时,对 Linux 的设置有哪些优化方法?)
    • [请解释有关 Elasticsearch 的 NRT?](#请解释有关 Elasticsearch 的 NRT?)
    • [elasticsearch 的 document 设计](#elasticsearch 的 document 设计)

Elasticsearch 读取数据

使用 RestFul API 向对应的 node 发送查询请求,根据 did 来判断在哪个 shard 上,返回的是 primary 和 replica的 node 节点集合。 这样会负载均衡地把查询发送到对应节点,之后对应节点接收到请求,将document 数据返回协调节点,协调节点把 document 返回给客户端。

您能解释一下 X-Pack for Elasticsearch 的功能和重要性吗?

X-Pack 是与 Elasticsearch 一起安装的扩展程序。

X-Pack 的各种功能包括安全性(基于⻆色的访问,特权/权限,⻆色和用户安 全性),监视,报告,警报等。

Elasticsearch 中的节点(比如共 20 个),其中的 10 个选了 一个master,另外 10 个选了另一个 master,怎么办?

  • 当集群 master 候选数量不小于 3 个时,可以通过设置最少投票通过数量(discovery.zen.minimum_master_nodes)超过所有候选节点一半以上 来解决脑裂问题;
  • 当候选数量为两个时,只能修改为唯一的一个 master 候选,其他作为data 节点,避免脑裂问题。

解释一下 Elasticsearch 集群中的索引的概念 ?

Elasticsearch 集群可以包含多个索引,与关系数据库相比,它们相当于数据库 表。

你可以列出 Elasticsearch 各种类型的分析器吗?

Elasticsearch Analyzer 的类型为内置分析器和自定义分析器。
Standard Analyzer

标准分析器是默认分词器,如果未指定,则使用该分词器。 它基于 Unicode 文本分割算法,适用于大多数语言。
Whitespace Analyzer

基于空格字符切词。
Stop Analyzer

在 simple Analyzer 的基础上,移除停用词。
Keyword Analyzer

不切词,将输入的整个串一起返回。
自定义分词器的模板

自定义分词器的在 Mapping 的 Setting 部分设置:

复制代码
PUT my\_custom\_index
{
	"settings":{
		"analysis":{
			"char\_filter":{
			},
			"tokenizer":{
			},
			"filter":{
			},
			"analyzer":{
			}
		}
	}
}

其中: "char_filter":{},------对应字符过滤部分; "tokenizer":{},------对应文本切分为分词部分;

"filter":{},------对应分词后再过滤部分; "analyzer":{}------对应分词器组成部分,其中会包含:1. 2. 3。

解释一下 Elasticsearch Node?

节点是 Elasticsearch 的实例。实际业务中,我们会说:ES 集群包含 3 个节 点、7 个节点。

这里节点实际就是:一个独立的 Elasticsearch 进程,一般将一个节点部署到 一台独立的服务器或者虚拟机、容器中。 不同节点根据⻆色不同,可以划分为:
主节点

帮助配置和管理在整个集群中添加和删除节点。
数据节点

存储数据并执行诸如 CRUD(创建/读取/更新/删除)操作,对数据进行搜索和 聚合的操作。
客户端节点(或者说:协调节点)

将集群请求转发到主节点,将与数据相 关的请求转发到数据节点。
摄取节点

用于在索引之前对文档进行预处理。

在安装 Elasticsearch 时,请说明不同的软件包及其重要性?

这个貌似没什么好说的,去官方文档下载对应操作系统安装包即可。 部分功能是收费的,如机器学习、高级别kerberos 认证安全等选型要知悉。

Elasticsearch 在部署时,对 Linux 的设置有哪些优化方法?

关闭缓存 swap;

堆内存设置为:Min(节点内存/2, 32GB);

设置最大文件句柄数;

线程池+队列大小根据业务需要做调整;

磁盘存储 raid 方式------存储有条件使用 RAID10,增加单节点性能以及避 免单节点存储故障。

请解释有关 Elasticsearch 的 NRT?

从文档索引(写入)到可搜索到之间的延迟默认一秒钟,因此 Elasticsearch 是近实时(NRT)搜索平台。

也就是说:文档写入,最快一秒钟被索引到,不能再快了。 写入调优的时候,我们通常会动态调整:refresh_interval = 30s 或者更达 值,以使得写入数据更晚一点时间被搜索到。

elasticsearch 的 document 设计

在使用 es 时 避免使用复杂的查询语句(Join 、聚合),就是在建立索引时, 就根据查询语句建立好对应的元数据。

相关推荐
武子康5 小时前
大数据-237 离线数仓 - Hive 广告业务实战:ODS→DWD 事件解析、广告明细与转化分析落地
大数据·后端·apache hive
大大大大晴天7 小时前
Flink生产问题排障-Kryo serializer scala extensions are not available
大数据·flink
Elasticsearch1 天前
如何使用 Agent Builder 排查 Kubernetes Pod 重启和 OOMKilled 事件
elasticsearch
Elasticsearch2 天前
通用表达式语言 ( CEL ): CEL 输入如何改进 Elastic Agent 集成中的数据收集
elasticsearch
武子康2 天前
大数据-236 离线数仓 - 会员指标验证、DataX 导出与广告业务 ODS/DWD/ADS 全流程
大数据·后端·apache hive
武子康3 天前
大数据-235 离线数仓 - 实战:Flume+HDFS+Hive 搭建 ODS/DWD/DWS/ADS 会员分析链路
大数据·后端·apache hive
DianSan_ERP4 天前
电商API接口全链路监控:构建坚不可摧的线上运维防线
大数据·运维·网络·人工智能·git·servlet
够快云库4 天前
能源行业非结构化数据治理实战:从数据沼泽到智能资产
大数据·人工智能·机器学习·企业文件安全
AI周红伟4 天前
周红伟:智能体全栈构建实操:OpenClaw部署+Agent Skills+Seedance+RAG从入门到实战
大数据·人工智能·大模型·智能体
B站计算机毕业设计超人4 天前
计算机毕业设计Django+Vue.js高考推荐系统 高考可视化 大数据毕业设计(源码+LW文档+PPT+详细讲解)
大数据·vue.js·hadoop·django·毕业设计·课程设计·推荐算法