【Elasticsearch】迁出节点”≠“恢复源节点

复制代码
ShardRouting source = startedShard.relocate(nodeId, expectedShardSize);
ShardRouting target = source.getTargetRelocatingShard();
updateAssigned(startedShard, source);
node(target.currentNodeId()).add(target);
assignedShardsAdd(target);
addRecovery(target); //找恢复源(这里用到的恢复源不一定是迁出节点的)
changes.relocationStarted(startedShard, target);
复制代码
@Nullable //给一个副本分片,返回一条“可以用来当恢复源”的主分片路由。
private ShardRouting findAssignedPrimaryIfPeerRecovery(ShardRouting routing) {
    ShardRouting primary = null;
    if (routing.recoverySource() != null && routing.recoverySource().getType() == RecoverySource.Type.PEER) {
        List<ShardRouting> shardRoutings = assignedShards.get(routing.shardId());
        if (shardRoutings != null) {
            for (ShardRouting shardRouting : shardRoutings) {
                if (shardRouting.primary()) {   //这里只选主分片
                    if (shardRouting.active()) {
                        return shardRouting;
                    } else if (primary == null) {
                        primary = shardRouting;
                    } else if (primary.relocatingNodeId() != null) { //如果当前这个shardRouting还没active,并且旧的主分片正在作为迁移源往外迁移,
                        primary = shardRouting;
                    }
                }
            }
        }
    }
    return primary;
}

完全正确 ------ **"迁出节点"≠"恢复源节点"**:

  1. `startedShard.relocate(...)` 只是**生成两条路由记录**:
  • **源**:状态 `RELOCATING`,仍在**原节点**;

  • **目标**:状态 `INITIALIZING`,在**新节点**。

  1. 后续副本做 **PEER 恢复**时,**选源逻辑只看"哪条主分片路由当前能提供数据"**(通常就是那条 `RELOCATING` 源记录),**不管它物理上在哪个节点**;

因此恢复流量走向是:

**"选中的主分片路由所在节点" → 副本节点**

  1. 如果主分片本身也在 relocating,**旧节点**上的 `RELOCATING` 源分片仍处于 `STARTED` 状态,**照样能当数据源**;

一旦旧主分片关闭、新主分片 `STARTED`,恢复源会自动切换到新节点。

**结论:**

**"迁出节点"只是路由表里的一个中间状态,真正的恢复源由 `findAssignedPrimaryIfPeerRecovery` 动态选择,两者没有绑定关系。**

相关推荐
极客数模17 小时前
【2026美赛赛题初步翻译F题】2026_ICM_Problem_F
大数据·c语言·python·数学建模·matlab
编程彩机19 小时前
互联网大厂Java面试:从分布式架构到大数据场景解析
java·大数据·微服务·spark·kafka·分布式事务·分布式架构
vx-bot55566619 小时前
企业微信接口在多租户SaaS平台中的集成架构与数据隔离实践
大数据·架构·企业微信
bubuly1 天前
软件开发全流程注意事项:从需求到运维的全方位指南
大数据·运维·数据库
xixixi777771 天前
基于零信任架构的通信
大数据·人工智能·架构·零信任·通信·个人隐私
Hello.Reader1 天前
Flink 自适应批执行(Adaptive Batch Execution)让 Batch 作业“边跑边优化”
大数据·flink·batch
LaughingZhu1 天前
Product Hunt 每日热榜 | 2026-01-31
大数据·人工智能·经验分享·搜索引擎·产品运营
babe小鑫1 天前
中专学历进入快消大厂终端销售岗位的可行性分析
大数据
samFuB1 天前
【工具变量】区县5A级旅游景区DID数据集(2000-2025年)
大数据
百夜﹍悠ゼ1 天前
数据治理DataHub安装部署
大数据·数据治理