BGP的“聪明选路”遇上了TCP的“路径洁癖”,需人工调和

在路由器R1上有两条外网,WAN1和WAN2。

R1上做了域名分流功能,全局网址分到WAN1,指定域名分到WAN2(优先级更高)。

症状是用户反馈部分网页无法打开。

于是各种检查尝试...... 2天过去了......

最终结论是:即使SYN请求通过R1的Wan1发出,服务器响应的目标IP(wan1的公网地址)可能被BGP策略判定为"通过wan2更优",导致响应包从wan2进入用户网络。

分析过程:

对TCP三次握手的影响:路径不对称导致连接失败

TCP协议要求连接路径​​双向一致​​(对称性),否则会破坏传输层的可靠性机制。以下是具体冲突点:

​​1.TCP序列号(Sequence Number)校验失败​​ ​​

请求阶段​​:客户端通过wan1发送SYN包(序列号Seq=X),服务器记录此序列号。 ​​

响应阶段​​:若SYN-ACK通过wan2返回,客户端预期确认号为Ack=X+1,但wan2转发的包可能因路径延迟或修改导致序列号不匹配。 ​​

结果​​:客户端丢弃SYN-ACK包,重传SYN请求(Wireshark显示TCP Retransmission) 。 ​​

2.NAT会话表失效

路由器在转发SYN请求时执行​​SNAT​​(源地址转换),将客户端内网IP替换为R1的公网IP,并记录会话表。

当SYN-ACK从wan2进入时,路由器发现此包不匹配R1的会话表条目,可能丢弃或错误转发。

3.实际现象​​

Chrome开发者工具显示ERR_CONNECTION_RESET或超时。

TCP状态机因路径不一致进入死锁(客户端等待SYN-ACK,服务器等待ACK确认)

NAT会话表失效​​

路由器在转发SYN请求时执行​​SNAT​​(源地址转换),将客户端内网IP替换为wan1的公网IP,并记录会话表。 当SYN-ACK从wan2进入时,路由器发现此包不匹配wan1的会话表条目,可能丢弃或错误转发 。 ​​实际现象​​ Chrome开发者工具显示ERR_CONNECTION_RESET或超时。 TCP状态机因路径不一致进入死锁(客户端等待SYN-ACK,服务器等待ACK确认)

以下是BGP的逐包独立选路特性,​​ BGP路由器对每个数据包的转发决策是独立的,基于以下优先级顺序 :

​​本地优先级​​:若wan2所在路径的优先级更高(如运营商策略优化),则优先选择;

AS路径长度(AS Path)​​:若通过wan2的路径经过的AS数量更少(如AS Path更短),则优选; ​​

MED值(多出口鉴别器)​​:若wan2所在入口的MED值更小(如成本更低),则流量被导向wan2;

​​其他规则​​:如权重(Weight)、下一跳IGP开销等。

ps:路由器R1的两个wan口分别对应两个不同的公网ip,请问运营商的设备是如何知道这两个ip就插在同一台设备上的?

答:运营商设备会记录R1的AS号,这个号是唯一的,所以两个ip对应as号一样,它就知道是同一台设备,所以会选对最短路。

相关推荐
湖南天硕国产SSD几秒前
工业存储可靠性进阶:天硕工业固态硬盘动态温控与寿命优化技术实践
网络·数据库·算法·工业存储·天硕存储·工业固态硬盘
light_in_hand几秒前
HTTPS 加密流程总结
网络协议·http·https
胡萝卜3.0几秒前
远程控制卡顿怎么办:连接失败排查、低延迟软件推荐与网络优化指南
网络
之歆3 分钟前
Node.js HTTP 模块深度解析与实战指南
网络协议·http·node.js
梁辰兴18 分钟前
计算机网络基础:P2P 文件分发的分析
网络·计算机网络·计算机·p2p·计算机网络基础·梁辰兴·文件分发分析
2601_9619633827 分钟前
从OCR到NLP:AI技术如何赋能电子合同智能审核与风险预警?
网络·人工智能·安全·金融·智能合约
CJH(本人账号)32 分钟前
大模型的“越狱“之路:从DAN到多模态注入,AI安全边界正在崩塌
网络·人工智能·安全
爱讲故事的33 分钟前
计算机网络第 5 章复习:Network Layer Control Plane(网络层控制平面)
网络·计算机网络·平面
潜创微科技39 分钟前
ITE IT920X 4K60 HDMI+USB over IP 远距离传输与视频墙单芯片方案
网络协议·tcp/ip·音视频
Zhan86112440 分钟前
深夜调试法国行情数据API接口的教训:法国CAC40指数WebSocket接入复盘
websocket·网络协议·php