Azure Local(或Windows HCI)虚拟机迁移走哪个网络

默认情况

答案:谁的Metric值最低就走谁。

Windows Failover Cluster 会自动给网络分配角色和Metric。

查看:

Get-ClusterNetwork | ft Name,Role,Metric

例如:

|---------------|--------------------|--------|
| 网络 | Role | Metric |
| Storage1 RDMA | Cluster and Client | 1000 |
| Storage2 RDMA | Cluster and Client | 1100 |
| Compuster | Cluster and Client | 2000 |

那么:

Live Migration

优先选择Metric最低网络

RDMA网络

因此:

很多S2D部署环境下,Live Migration会优先跑到25Gb RDMA网络。

微软推荐方式

微软官方HCI设计:

25Gb RDMA

Storage Traffic

10Gb

Management

Cluster

Live Migration

即:

Storage和Migration分离

原因:

如果迁移走RDMA网络:

50GB VM迁移

占满25Gb带宽

Storage Replica同步延迟增加

CSV IO延迟上升

因此生产环境通常:

Set-VMHost -VirtualMachineMigrationPerformanceOption SMB

然后指定迁移网络:

Set-VMHost `

-UseAnyNetworkForMigration $false

Hyper-V设置:

Live Migration Networks

√ Compute Network

× Storage Network

这样:

Live Migration

10Gb Compute

Storage

25Gb RDMA

如果不做配置?

很多情况下会出现:

Storage Traffic

Live Migration

共用25Gb RDMA

因为Windows认为:

最快的网络

=

最适合迁移

为了避免虚拟机在迁移瞬间挤爆存信网络,尤其是大内存的虚拟机迁移,挤爆存储网络是大概率事件,导致虚拟机无法访问后端存储被瞬间挂起中断。因此,微软Azure Local与Windows Server HCI解决方案中,微软推荐配置QoS。