故障复盘:前置机双网卡导致的路由冲突(XX医院院,偶发网络连接不上,因为路由网卡随机导致)
- 故障现象
应用层表现:Nginx 日志报错 upstream timed out (10060),业务无法正常访问后端服务。
网络层表现:作为调试入口的前置机,无法 ping 通目标服务器网址,且 tracert 后端IP 第一跳即超时。 - 根因分析
环境背景:前置机配置了双网卡(双 IP),同时连接了内网(10.11.10.x)和外网/业务网(192.168.9.x)。
冲突点:路由表中存在两条默认路由(0.0.0.0),分别指向两个不同的网关,且优先级(跃点数)相同。
故障逻辑:
前置机尝试访问服务器网址。
Windows 系统在两条路由间"摇摆",随机选择了一条路径。
当数据包被错误地发往内网网关(10.11.10.1)时,内网网关无法转发去往公网/业务网 IP 的流量,直接丢弃。
导致前置机与后端网络不通,进而引发 Nginx 连接超时。 - 解决步骤(在前置机上执行)
通过管理员权限的 CMD,手动修正路由表,强制"内外网分流"。
清除旧配置
删除所有冲突的默认路由,防止系统继续"掷骰子"。
查看路由表信息
cmd(超级管理员模式)
route print -4 ------后面的命令可以用这个的结果发给AI,让AI帮完善,防止写错IP
cmd(超级管理员模式)
route delete 0.0.0.0
指定外网出口(高优先级)
强制所有互联网/业务网流量走 192.168.9.1 网关。
cmd(超级管理员模式)
route add -p 0.0.0.0 mask 0.0.0.0 192.168.9.1 metric 10
指定内网出口(低优先级)
强制内网流量(10.x.x.x)走 10.11.10.1 网关。
cmd(超级管理员模式)
route add -p 10.0.0.0 mask 255.0.0.0 10.11.10.1 metric 20 - 最终结论
这是一次典型的客户端(前置机)网络配置不当引发的"假性"服务端故障。
误区:看到 Nginx 报错 upstream timed out,容易误以为是后端服务挂了或服务器防火墙拦截。
真相:后端服务正常,防火墙正常。问题出在发起请求的源头(前置机)因为双网卡路由冲突,导致请求包"迷路"被丢弃。
建议:如果这台前置机是团队共用的跳板机,建议检查其他同事的电脑是否也有类似的双网卡配置,避免类似问题再次发生。