两种恢复最终都要**让副本的 Lucene 段文件跟主分片一致**,但"动手对象"不同:
- **文件级(file-based)**
-
直接复制**整个段文件(.cfs、.si、.dvd ...)**到副本节点
-
副本**原样替换**自己的目录,**不再逐条解析**
-
过程中**不打开 Lucene 文档**,只搬运字节;最后由副本自己打开 IndexWriter 做一次 commit 即可
- **操作级(ops-based)**
-
不复制段文件,而是**一条条发 Translog.Operation**
-
副本收到后,**在本地的 IndexWriter 上重放**:addDocument、deleteDocument、updateDocument ...
-
每条操作都会**实时写副本的 Lucene 段**,也会写副本的 translog,最后 commit
→ 所以:
-
**文件级**:**主分片**的 Lucene 文件 → **副本磁盘**(字节搬运)
-
**操作级**:**主分片**的 Lucene 文档 → **反序列化成操作** → **副本 IndexWriter** → **副本的 Lucene 文件**(逐条写入)
**最终都是让副本的 Lucene 段保持一致,只是路径不同:一个"整块复制",一个"逐条重放"。**
操作级(ops-based)恢复跟**物理 translog 文件**完全无关:
-
主分片**不读自己的 `.tlog` 文件**;
-
用 `LuceneChangesSnapshot` **直接从 Lucene 倒排表里**按 `_seq_no` 把文档/墓碑捞出来;
-
现场包成 `Translog.Index` / `Delete` / `NoOp` 对象发给副本;
-
副本收到后,**在自己的 IndexWriter 上重放**这些操作,生成**自己的** Lucene 段。
因此整个流程**既不读主分片的 translog 文件,也不依赖 translog 文件做传输**,只是借用了"Translog.Operation"这个统一的数据结构而已。