Interview preparation--Elasticsearch并发控制

生病的毛毛虫2024-07-01 13:48

Elasticsearch 并发控制

Elasticsearch是分布式的。创建，更新，删除文档时，必须将文档的新版本复制到集群中的其他节点。ES也是异步并行的，所有这些复制请求是并行发送的，并且可能不安顺序执行到每一个节点。ES需要一种并发策略来保证数据的安全性，而这种策略就是乐观锁并发控制策略。
为了保证旧文档不会被新文档覆盖，对文档执行的每个操作都由协调该更改的主分片分配一个序列号（_seq_no）。每个操作都会操作序列号递增，因此可以保证较新的操作具有更高的序列号。然后，ES 可以使用操作序列号来确保更新的文档版本永远不会被分配了较小序列号的版本覆盖。

版本号： _version

基本原理：
每个索引文档都有一个版本号。默认情况下，使用从1 开始的内部版本控制，每次更新都会增加。可选操作是，版本号可以设置为外部（比如在数据库中维护）。可以通过设置version_type = external。提供的值必须大于或等于0 而且小于9.2e + 18 左右的数字长整型值。
如果设置了version_type = external，在用外部版本类型时候，系统会检查传递给索引请求的版本号是否大于当前存储文档的版本。如果为真，文档将被索引并使用新的版本号。如果提供的值小于或等于存储文档的版本号，则会发生版本冲突，索引操作将失败。
_version 的有效范围是当前文档

使用if_seq_no 和 if_primary_term 进行版本控制

if_seq_no 和 if_primary_term 是用来并发控制，和 _version不同，_version属于当前文档，而 _seq_no属于整个index。
if_seq_no ：索引级别的版本号，索引中所有文档共享一个 _seq_no
_primary_term：是一个整数，当Primary Shard发生重新分配的时候，比如节点冲突，Primary选举或者重新分配等，_primary_term会递增1，主要用来恢复数据时候处理多个文档的_seq_no一样时候避免冲突，避免Primary Shard 上的数据被覆盖。

上一篇：数据库的嵌套查询是个什么事？

下一篇：微服务应用与开发知识点练习【Gateway,OpenFeign,Dubbo,RocketMQ和RabbitMQ,JPA,Redis,Mycat】

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 0300 Debian字符界面如何支持中文 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？072026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 08AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 09Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 102026 年 AI 大模型 & AI 编程工具实战全总结