【Elasticsearch】迁出节点”≠“恢复源节点

复制代码
ShardRouting source = startedShard.relocate(nodeId, expectedShardSize);
ShardRouting target = source.getTargetRelocatingShard();
updateAssigned(startedShard, source);
node(target.currentNodeId()).add(target);
assignedShardsAdd(target);
addRecovery(target); //找恢复源(这里用到的恢复源不一定是迁出节点的)
changes.relocationStarted(startedShard, target);
复制代码
@Nullable //给一个副本分片,返回一条“可以用来当恢复源”的主分片路由。
private ShardRouting findAssignedPrimaryIfPeerRecovery(ShardRouting routing) {
    ShardRouting primary = null;
    if (routing.recoverySource() != null && routing.recoverySource().getType() == RecoverySource.Type.PEER) {
        List<ShardRouting> shardRoutings = assignedShards.get(routing.shardId());
        if (shardRoutings != null) {
            for (ShardRouting shardRouting : shardRoutings) {
                if (shardRouting.primary()) {   //这里只选主分片
                    if (shardRouting.active()) {
                        return shardRouting;
                    } else if (primary == null) {
                        primary = shardRouting;
                    } else if (primary.relocatingNodeId() != null) { //如果当前这个shardRouting还没active,并且旧的主分片正在作为迁移源往外迁移,
                        primary = shardRouting;
                    }
                }
            }
        }
    }
    return primary;
}

完全正确 ------ **"迁出节点"≠"恢复源节点"**:

  1. `startedShard.relocate(...)` 只是**生成两条路由记录**:
  • **源**:状态 `RELOCATING`,仍在**原节点**;

  • **目标**:状态 `INITIALIZING`,在**新节点**。

  1. 后续副本做 **PEER 恢复**时,**选源逻辑只看"哪条主分片路由当前能提供数据"**(通常就是那条 `RELOCATING` 源记录),**不管它物理上在哪个节点**;

因此恢复流量走向是:

**"选中的主分片路由所在节点" → 副本节点**

  1. 如果主分片本身也在 relocating,**旧节点**上的 `RELOCATING` 源分片仍处于 `STARTED` 状态,**照样能当数据源**;

一旦旧主分片关闭、新主分片 `STARTED`,恢复源会自动切换到新节点。

**结论:**

**"迁出节点"只是路由表里的一个中间状态,真正的恢复源由 `findAssignedPrimaryIfPeerRecovery` 动态选择,两者没有绑定关系。**

相关推荐
武子康20 小时前
大数据-237 离线数仓 - Hive 广告业务实战:ODS→DWD 事件解析、广告明细与转化分析落地
大数据·后端·apache hive
大大大大晴天1 天前
Flink生产问题排障-Kryo serializer scala extensions are not available
大数据·flink
Elasticsearch2 天前
如何使用 Agent Builder 排查 Kubernetes Pod 重启和 OOMKilled 事件
elasticsearch
Elasticsearch3 天前
通用表达式语言 ( CEL ): CEL 输入如何改进 Elastic Agent 集成中的数据收集
elasticsearch
武子康3 天前
大数据-236 离线数仓 - 会员指标验证、DataX 导出与广告业务 ODS/DWD/ADS 全流程
大数据·后端·apache hive
武子康4 天前
大数据-235 离线数仓 - 实战:Flume+HDFS+Hive 搭建 ODS/DWD/DWS/ADS 会员分析链路
大数据·后端·apache hive
DianSan_ERP5 天前
电商API接口全链路监控:构建坚不可摧的线上运维防线
大数据·运维·网络·人工智能·git·servlet
够快云库5 天前
能源行业非结构化数据治理实战:从数据沼泽到智能资产
大数据·人工智能·机器学习·企业文件安全
AI周红伟5 天前
周红伟:智能体全栈构建实操:OpenClaw部署+Agent Skills+Seedance+RAG从入门到实战
大数据·人工智能·大模型·智能体
B站计算机毕业设计超人5 天前
计算机毕业设计Django+Vue.js高考推荐系统 高考可视化 大数据毕业设计(源码+LW文档+PPT+详细讲解)
大数据·vue.js·hadoop·django·毕业设计·课程设计·推荐算法