在 Azure Local(即原 Azure Stack HCI) 与 Windows Server HCI(如 Windows Server 2025)的 Scalable(可扩展多节点)架构 中,系统支持从 2 到 16 个节点的大规模集群部署。在此架构下, 网络流通常被划分为三大核心意图(Intents):管理(Management) 、计算(Compute/VM) 以及存储(Storage/RDMA) 。
根据这三种流量在物理网卡和交换机上的合并与分离状态,网络拓扑主要分为 融合架构(Fully Converged) 与 非融合架构(Non-Converged) 。两种架构的底层均推荐使用 Network ATC(网络意图配置工具)进行自动化对称部署。
一、 融合架构(Fully Converged)网络拓扑
融合架构 的核心是最大化硬件复用,即将管理、计算和存储三大流量全部无缝合并到同一组高速物理网卡及交换机端口上。

1. 物理拓扑
- 物理网卡(NIC):每台服务器通常配置 1 组高带宽的双端口或四端口网卡(如 25GbE/100GbE),所有端口必须是同芯片、同速率且支持 RDMA(RoCE 或 iWARP)。
- 物理交换机 :所有网卡端口交叉上联至两台机架顶(TOR)交换机,交换机之间配置 vPC/MLAG 堆叠以提供链路冗余。 [1](https://learn.microsoft.com/en-us/azure/azure-local/plan/two-node-switched-converged?view=azloc-2606 "1"), [2](https://news.microsoft.com/source/asia/2021/04/05/%E5%BE%AE%E8%BD%AF-azure-stack-hci-%E6%B7%B7%E5%90%88%E4%BA%91%E8%A7%A3%E5%86%B3%E6%96%B9%E6%A1%88%E8%90%BD%E5%9C%B0%E4%B8%AD%E5%9B%BD%E5%B8%82%E5%9C%BA/?lang=zh-hans "2"), [3](https://infohub.delltechnologies.com/en-us/l/deployment-and-operations-guide-with-scalable-networking/solution-integration-and-network-connectivity-84/ "3")
2. 主机逻辑拓扑
- 组合技术 :所有物理端口被捆绑为一个统一的交换机嵌入式组合(SET, Switch-Embedded Team)。
- 虚拟适配器(vNICs) :在 Hyper-V 虚拟交换机之上,为管理、VM 和存储分别创建专用的管理操作系统虚拟网卡(Management OS vNICs)。
- 管理与计算:绑定至特定的 VLAN,管理流量通常走原生(Native)或指定 VLAN。
- 存储流量:创建 2 个虚拟存储适配器(vStorage 1 和 vStorage 2),各自映射不同的 SMB 存储子网和 VLAN,分别对应硬件上的不同物理端口,以确保 SMB 多通道(SMB Multichannel)高并发。
3. 流量控制与 QoS(关键要素)
由于存储(RDMA)与业务虚机流量高度混跑,必须启用严格的流量控制。
- 若采用 RoCEv2 ,必须在物理交换机和 OS 主机端同时启用 DCB(数据中心桥接) 、PFC(基于优先级的流量控制) 和 ETS(增强传输选择),通常为 RDMA 划拨不低于 50% 的保底带宽,防止存储流量因网络拥堵而丢包。
- 如果 RDMA 网络采用 iWARP , iWARP 的核心优势在于它运行在标准的 TCP 协议栈之上 ,自带 TCP 的拥塞控制和重传机制。因此不需要像 RoCEv2 那样强制依赖物理交换机配置复杂的 DCB(数据中心桥接)和 PFC(基于优先级的流量控制)。
二、 非融合架构(Non-Converged)网络拓扑
非融合架构 的核心是物理隔离与高稳定性,它将对延迟和带宽极度敏感的存储(RDMA)流量,与管理/计算流量彻底剥离到不同的物理网卡上。

1. 物理拓扑
- 物理网卡(NIC) :每台服务器至少需要 2 组独立的网卡适配器 。
- 网卡 1(管理/计算):通常使用主板集成 LOM 或 OCP 网卡(如双端口 10GbE 或 25GbE)。
- 网卡 2(存储专用) :使用高性能 PCIe 插槽扩展卡(如双端口 25GbE/100GbE),必须原生支持 RDMA。
- 物理交换机:管理网卡与存储网卡各自上联至 TOR 交换机的不同端口或完全隔离的交换机上,通过 VLAN 进行二层和三层隔离。
2. 主机逻辑拓扑
- 管理与计算堆栈 :网卡 1 的物理端口组成一个 SET 组合,并在其上创建虚拟交换机,用于宿主机管理流量(vManagement)以及 VM 业务流量(vCompute)。
- 存储堆栈 :网卡 2 的专用存储物理端口不创建 Hyper-V 虚拟交换机,也不进行 Team 捆绑 。
- StorageSpaces Direct(S2D)存储流量直接落在物理网卡接口上 。
- 每个存储物理端口直接配置独立的静态 IP 地址和专属存储 VLAN。
3. 优点与适用场景
- 无资源争抢:存储 RDMA 独占网卡 2 的物理带宽,业务虚机大流量不会影响到存储的 IOPS 性能。
- 易于维护 :由于存储不经过虚拟交换机(vSwitch)层转换,网络排错和交换机配置(如使用 iWARP 时通常无需在交换机配置复杂的 DCB)更为简单。适合高写入、重 I/O 负载的计算与存储密集型现代数据中心。
三、 融合与非融合架构对比总结
针对 Azure Local / Windows Server HCI 的 Scalable 架构,两者的核心差异如下表所示:
| 比较维度 | 融合架构(Fully Converged) | 非融合架构(Non-Converged) |
|---|---|---|
| 网卡硬件开销 | 更低。仅需一组双端口/四端口高速网卡。 | 更高。需要至少两组独立的网卡(如 OCP+PCIe)。 |
| 交换机端口占用 | 每个节点占用 2 或 4 个 TOR 交换机端口。 | 每个节点占用 4 个 TOR 交换机端口。 |
| 存储适配器类型 | 主机 OS 中的 虚拟网卡(vNIC)。 | 直接使用 物理网卡端口(pNIC)。 |
| QoS / DCB 依赖 | 极高。若用 RoCEv2,必须严格配置全局 PFC/ETS。 | 较低。存储专属网卡带宽独立,不易受业务干扰。 |
| Network ATC 意图配置 | 创建 1 个包含所有流量的合并意图: Management, Compute, Storage |
创建 2 个相互隔离的独立意图: 1. Management, Compute 2. Storage |
| 最佳适用场景 | 边缘计算、分支机构(ROBO)、端口资源紧缺的环境。 | 大型核心数据中心、高 IOPS 数据库、大规模扩展群集。 |
Azure Local与Windows Server 2025 HCI的Scalable架构是客户在不增加购置物理交换机成本的情况下,优先考虑的部署架构。它能够最大程度上保证性能的同时也简化了后期的运维与管理。