默认情况
答案:谁的Metric值最低就走谁。
Windows Failover Cluster 会自动给网络分配角色和Metric。
查看:
Get-ClusterNetwork | ft Name,Role,Metric
例如:
|---------------|--------------------|--------|
| 网络 | Role | Metric |
| Storage1 RDMA | Cluster and Client | 1000 |
| Storage2 RDMA | Cluster and Client | 1100 |
| Compuster | Cluster and Client | 2000 |
那么:
Live Migration
↓
优先选择Metric最低网络
↓
RDMA网络
因此:
很多S2D部署环境下,Live Migration会优先跑到25Gb RDMA网络。
微软推荐方式
微软官方HCI设计:
25Gb RDMA
↓
Storage Traffic
10Gb
↓
Management
Cluster
Live Migration
即:
Storage和Migration分离
原因:
如果迁移走RDMA网络:
50GB VM迁移
↓
占满25Gb带宽
↓
Storage Replica同步延迟增加
↓
CSV IO延迟上升
因此生产环境通常:
Set-VMHost -VirtualMachineMigrationPerformanceOption SMB
然后指定迁移网络:
Set-VMHost `
-UseAnyNetworkForMigration $false
Hyper-V设置:
Live Migration Networks
√ Compute Network
× Storage Network
这样:
Live Migration
↓
10Gb Compute
Storage
↓
25Gb RDMA
如果不做配置?
很多情况下会出现:
Storage Traffic
Live Migration
共用25Gb RDMA
因为Windows认为:
最快的网络
=
最适合迁移
为了避免虚拟机在迁移瞬间挤爆存信网络,尤其是大内存的虚拟机迁移,挤爆存储网络是大概率事件,导致虚拟机无法访问后端存储被瞬间挂起中断。因此,微软Azure Local与Windows Server HCI解决方案中,微软推荐配置QoS。