SXi LAG 链路聚合负载均衡配置全教程 | LACP 协议 + 交换机联动,新手也能落地

很多 VMware 用户想通过多网口绑定(LAG)提升 ESXi 主机带宽、实现链路冗余,却常遇到配置失效、流量负载不均、网络闪断甚至主机失联的问题,核心原因是没做好 LACP 协议与物理交换机的端到端联动,以及负载均衡模式选型错误。本文梳理了 ESXi 环境 LAG 配置的完整流程,重点讲解 LACP 协议配置规则、交换机联动要求,以及 IP Hash 与 LACP Active 两种核心模式的选型与落地步骤,新手也能照着操作。


一、基础概念扫盲:搞懂 LAG 与 LACP 的核心逻辑

  • LAG(链路聚合组) :也叫端口绑定 / 端口聚合,是将主机上多个同规格的物理网口,绑定成一个逻辑网口,最终实现带宽叠加 (2 个千兆网口可叠加至 2Gbps 带宽)+链路冗余(单个网口 / 网线故障不中断网络)。
  • LACP(链路聚合控制协议) :IEEE 802.3ad 标准的官方协议,是 LAG 稳定运行的核心。它的核心规则是必须端到端配置------ESXi 主机和上联的物理交换机,必须同时开启并配置完全匹配的参数,单侧配置必然导致聚合失效、网络环路甚至断网。

二、配置前必看:两种核心模式选型 & 适用场景

本文核心推荐的两种官方合规模式,适配绝大多数 ESXi 使用场景,选型规则清晰明了:

表格

模式类型 核心适配场景 核心优势 交换机要求
LACP Active(动态聚合) 有 vCenter 的生产集群环境、企业级场景 支持动态链路协商、故障自动切换,稳定性最高,是官方首推方案 必须是支持 802.3ad LACP 协议的网管型交换机
IP Hash(静态聚合) 单节点 ESXi 主机、无 vCenter 的小型环境、不支持 LACP 的交换机 配置简单,无需复杂的协议协商,可快速实现带宽叠加 需支持静态链路聚合,可无 LACP 协议支持

关键提醒:ESXi 标准虚拟交换机(vSS)仅支持 IP Hash 静态聚合;只有分布式虚拟交换机(vDS,需 vCenter 管理)才完整支持 LACP Active 动态聚合模式,切勿选错环境。

三、配置前通用前置准备(避坑前提,必须完成)

  1. 硬件准备:ESXi 主机需配备 2 个及以上同速率、同规格的物理网口(如均为千兆 / 万兆,优先同芯片型号),所有待绑定网口均连接到同一台物理交换机。
  2. 风险规避:预留 1 个不加入聚合组的独立管理网口,避免配置错误导致 ESXi 主机完全失联;提前备份 ESXi 主机网络配置,关闭待绑定网口的独立 VLAN、端口策略等无关配置。
  3. 环境预检:确认上联交换机为网管型交换机,对应端口的 VLAN、速率、双工模式已提前规划,且两端参数需完全一致;生产环境需将 ESXi 主机进入维护模式,关闭业务虚拟机。

四、第一步:先配置物理交换机侧(核心联动,顺序绝对不能反)

LAG 配置失败的 80% 原因,是先配了 ESXi 侧、后配交换机侧,或两端参数不匹配。必须先完成交换机侧配置,再操作 ESXi 侧

(一)LACP Active 模式对应的交换机配置

  1. 登录交换机管理界面,进入全局配置模式,创建链路聚合组(华为 / 华三叫 Eth-Trunk,思科 / 锐捷叫 Port-Channel),将聚合组模式设置为LACP 主动模式(Active),与 ESXi 侧保持一致。
  2. 将 ESXi 主机连接的对应物理端口,批量加入该聚合组,端口模式设置为与 ESXi 虚拟交换机匹配的 access/trunk 模式,统一 VLAN 配置,确保所有端口参数完全一致。
  3. 将聚合组的负载均衡算法,强制设置为源目 IP 哈希算法,与 ESXi 侧匹配;关闭端口的环路检测、STP 等可能影响 LACP 协商的配置。
  4. 保存配置,查看聚合组状态,确认端口已启用、无报错,等待 ESXi 侧配置完成后进行协商。

(二)IP Hash 模式对应的交换机配置

  1. 登录交换机管理界面,创建静态链路聚合组,关闭 LACP 协议,设置为手动静态聚合模式。
  2. 将对应物理端口加入静态聚合组,统一所有端口的 VLAN、速率、双工模式,确保参数完全一致。
  3. 强制配置交换机的负载均衡算法为源目 IP 哈希算法,必须与 ESXi 侧的 IP Hash 模式 100% 匹配,否则会出现流量单口跑满、负载不均的问题。
  4. 保存配置,确认静态聚合组状态正常,无端口 down 掉的情况。

五、第二步:ESXi 侧 LAG 负载均衡配置

(一)LACP Active 模式配置(vCenter+vDS 环境,生产环境首选)

  1. 登录 vCenter Server,进入【网络】界面,选中目标分布式交换机(vDS),右键选择【新建链路聚合组 LAG】。
  2. 配置 LAG 核心参数:设置自定义名称,端口数量与待绑定的物理网口数量一致,LACP 模式选择 "主动(Active)",负载均衡模式选择 "基于源和目标 IP 的哈希",其余参数保持默认,点击完成。
  3. 绑定物理网口:进入 vDS 的【主机和交换机】选项卡,选中目标 ESXi 主机,将待绑定的物理网口,全部分配到新建的 LAG 组中,替换原有的独立上行链路。
  4. 调整端口组策略:进入 vDS 对应的业务 / 管理端口组,编辑配置,将负载均衡模式改为【使用明确的故障切换顺序】,将新建的 LAG 组设为活动上行链路,其余独立上行链路设为备用,点击确认保存。
  5. 配置完成后,等待 10-30 秒,ESXi 主机会自动与交换机完成 LACP 协议协商。

(二)IP Hash 模式配置(单节点 ESXi+vSS 环境,新手友好)

  1. 登录 ESXi 网页管理界面,进入【网络】-【虚拟交换机】,选中需要配置的标准虚拟交换机(vSwitch),点击【编辑设置】。
  2. 切换到【绑定和故障切换】选项卡,这是配置的核心步骤:负载均衡算法选择 "基于源和目标 IP 的哈希(IP Hash)",网络故障检测选择 "仅链路状态",开启 "通知交换机" 选项,故障恢复设置为 "立即恢复"。
  3. 在上行链路配置中,将所有待绑定的物理网口,全部移入【活动上行链路】列表,确保没有网口留在备用或未使用列表中。
  4. 核对所有配置无误后,点击【保存】,ESXi 侧静态聚合配置即刻生效。

六、配置完成后:状态验证与效果确认

  1. 协议状态验证:登录交换机,查看聚合组状态,LACP Active 模式需确认协商成功、所有端口均处于 UP 状态;IP Hash 模式需确认静态聚合组运行正常,无错误包、丢包。
  2. ESXi 侧连通性验证:登录 ESXi/vCenter,查看虚拟交换机上行链路,所有绑定网口均显示 "已连接",无链路告警;通过 ping 测试跨网段连通性,确认无丢包、无高延迟。
  3. 负载均衡效果验证:通过多台虚拟机同时进行大流量文件传输、带宽测速,查看每个物理网口的流量占用,确认流量均匀分配到多个网口,实现带宽叠加。
  4. 冗余性验证:拔掉其中一个绑定网口的网线,确认虚拟机网络无中断,流量自动切换到剩余正常网口,验证冗余功能生效。

七、高频踩坑避坑指南

  1. 最核心错误:单侧配置。只改 ESXi 侧、不配置交换机侧,或两端模式 / 算法不匹配,必然导致聚合失效、网络环路,必须保证两端参数 100% 一致。
  2. 环境适配错误:在标准虚拟交换机(vSS)上配置 LACP 动态模式,vSS 本身不支持 LACP 协商,强行配置只会导致网络异常。
  3. 硬件规格不一致:绑定不同速率、不同芯片的网口,会导致聚合失败、流量负载不均,必须使用同规格的物理网口。
  4. 管理口全量绑定:将所有管理网口都加入聚合组,配置错误时会直接导致 ESXi 主机失联,必须预留独立的应急管理网口。

总结

ESXi LAG 负载均衡配置的核心,就是严格遵循 "端到端联动" 的规则,LACP 协议必须配合物理交换机双侧配置。生产集群环境优先选择 vDS 的 LACP Active 模式,稳定性和冗余性最优;单节点小型环境,选择 vSS 的 IP Hash 静态模式,配置更简单易落地。只要做好两端参数匹配,就能稳定实现多网口的带宽叠加与链路冗余。

相关推荐
BingoGo9 小时前
PHP 泛型之殇 泛型 RFC 提案被拒绝
后端·php
JaguarJack9 小时前
PHP 泛型之殇 泛型 RFC 提案被拒绝
后端·php
用户3074596982071 天前
PHP 扩展——从入门到理解
php
鹏仔先生2 天前
拷贝漫画APP下载页PHP程序,后台带免费AI写作
php
大树882 天前
金刚石散热越强,管路越先见顶
大数据·运维·服务器·人工智能·ai
摇滚侠2 天前
Linux CentOS7 rpm 安装 MySQL 5.7
linux·运维·mysql
霸道流氓气质2 天前
领域驱动设计(DDD)在 Spring Boot 微服务中的实践指南
运维·spring boot·微服务
小宇宙Zz2 天前
Maven依赖冲突
java·服务器·maven
Inhand陈工2 天前
基于台达PLC与映翰通IG502的智慧水产养殖精准投喂与远程运维解决方案
运维·人工智能·物联网·阿里云·信息与通信
酣大智2 天前
ARP代理--工作原理
运维·网络·arp·arp代理