【Elasticsearch】副本恢复机制文件级（file-based）操作级（ops-based）顶级理解

risc1234562025-12-18 8:12

两种恢复最终都要**让副本的 Lucene 段文件跟主分片一致**，但"动手对象"不同：

**文件级（file-based）**

直接复制**整个段文件（.cfs、.si、.dvd ...）**到副本节点
副本**原样替换**自己的目录，**不再逐条解析**
过程中**不打开 Lucene 文档**，只搬运字节；最后由副本自己打开 IndexWriter 做一次 commit 即可

**操作级（ops-based）**

不复制段文件，而是**一条条发 Translog.Operation**
副本收到后，**在本地的 IndexWriter 上重放**：addDocument、deleteDocument、updateDocument ...
每条操作都会**实时写副本的 Lucene 段**，也会写副本的 translog，最后 commit

→ 所以：

**文件级**：**主分片**的 Lucene 文件 → **副本磁盘**（字节搬运）
**操作级**：**主分片**的 Lucene 文档 → **反序列化成操作** → **副本 IndexWriter** → **副本的 Lucene 文件**（逐条写入）

**最终都是让副本的 Lucene 段保持一致，只是路径不同：一个"整块复制"，一个"逐条重放"。**

操作级（ops-based）恢复跟**物理 translog 文件**完全无关：

主分片**不读自己的 `.tlog` 文件**；
用 `LuceneChangesSnapshot` **直接从 Lucene 倒排表里**按 `_seq_no` 把文档/墓碑捞出来；
现场包成 `Translog.Index` / `Delete` / `NoOp` 对象发给副本；
副本收到后，**在自己的 IndexWriter 上重放**这些操作，生成**自己的** Lucene 段。

因此整个流程**既不读主分片的 translog 文件，也不依赖 translog 文件做传输**，只是借用了"Translog.Operation"这个统一的数据结构而已。

上一篇：STM32简介

下一篇：【Linux进程（二）】Linux进程的诞生、管理与消亡：一份基于内核视角的完整分析

热门推荐

01GitHub 镜像站点 02Codex 接入 DeepSeek API 完整配置文档 03CC-Switch & Claude 基于 Linux 服务器安装使用指南 04【踩坑记录 | 第一篇】微软商店无法使用时，如何手动安装 OpenAI Codex？附`.msix`文件系统错误解决方法 05几个好用的ip纯净度检测网站 06裂开！ChatGPT 居然开始要手机号验证，附详细解决方法 07装上就回不去了：CodeGraph 让 AI 编程效率飙升 92%，它到底做了什么？08用了半年 OpenRouter，我换到了 Ofox.ai — 两个 AI API 聚合平台的真实对比 09codex app每次打开重连5次Reconnecting问题解决 10【AI】2026 年具身智能模型和世界模型总结