故障复盘:前置机双网卡导致的路由冲突(XX医院院,偶发网络连接不上,路由网卡随机导致)

故障复盘:前置机双网卡导致的路由冲突(XX医院院,偶发网络连接不上,因为路由网卡随机导致)

  1. 故障现象
    应用层表现:Nginx 日志报错 upstream timed out (10060),业务无法正常访问后端服务。
    网络层表现:作为调试入口的前置机,无法 ping 通目标服务器网址,且 tracert 后端IP 第一跳即超时。
  2. 根因分析
    环境背景:前置机配置了双网卡(双 IP),同时连接了内网(10.11.10.x)和外网/业务网(192.168.9.x)。
    冲突点:路由表中存在两条默认路由(0.0.0.0),分别指向两个不同的网关,且优先级(跃点数)相同。
    故障逻辑:
    前置机尝试访问服务器网址。
    Windows 系统在两条路由间"摇摆",随机选择了一条路径。
    当数据包被错误地发往内网网关(10.11.10.1)时,内网网关无法转发去往公网/业务网 IP 的流量,直接丢弃。
    导致前置机与后端网络不通,进而引发 Nginx 连接超时。
  3. 解决步骤(在前置机上执行)
    通过管理员权限的 CMD,手动修正路由表,强制"内外网分流"。
    清除旧配置
    删除所有冲突的默认路由,防止系统继续"掷骰子"。
    查看路由表信息
    cmd(超级管理员模式)
    route print -4 ------后面的命令可以用这个的结果发给AI,让AI帮完善,防止写错IP
    cmd(超级管理员模式)
    route delete 0.0.0.0
    指定外网出口(高优先级)
    强制所有互联网/业务网流量走 192.168.9.1 网关。
    cmd(超级管理员模式)
    route add -p 0.0.0.0 mask 0.0.0.0 192.168.9.1 metric 10
    指定内网出口(低优先级)
    强制内网流量(10.x.x.x)走 10.11.10.1 网关。
    cmd(超级管理员模式)
    route add -p 10.0.0.0 mask 255.0.0.0 10.11.10.1 metric 20
  4. 最终结论
    这是一次典型的客户端(前置机)网络配置不当引发的"假性"服务端故障。
    误区:看到 Nginx 报错 upstream timed out,容易误以为是后端服务挂了或服务器防火墙拦截。
    真相:后端服务正常,防火墙正常。问题出在发起请求的源头(前置机)因为双网卡路由冲突,导致请求包"迷路"被丢弃。
    建议:如果这台前置机是团队共用的跳板机,建议检查其他同事的电脑是否也有类似的双网卡配置,避免类似问题再次发生。
相关推荐
geNE GENT19 小时前
Nginx WebSocket 长连接及数据容量配置
运维·websocket·nginx
小百菜1 天前
Keepalived + Nginx 实现高可用
nginx·keepalived
驾驭人生1 天前
ASP.NET Core 实现 SSE 服务器推送|生产级实战教程(含跨域 / Nginx / 前端完整代码)
服务器·前端·nginx
Linux运维技术栈1 天前
生产环境Certbot泛域名证书全自动续期完整配置指南(Cloudflare DNS验证)
nginx·证书·ssl
SeSs IZED1 天前
【Nginx 】Nginx 部署前端 vue 项目
前端·vue.js·nginx
wuyikeer1 天前
Nginx反向代理出现502 Bad Gateway问题的解决方案
运维·nginx·gateway
LSL666_1 天前
nginx——方向代理和负载均衡
运维·nginx·负载均衡·反向代理
语戚1 天前
Nginx vs Ribbon:负载均衡的两种核心范式(反向代理 vs 客户端负载)
java·nginx·spring·spring cloud·面试·ribbon·负载均衡
芳草萋萋鹦鹉洲哦2 天前
【windows】nginx如何注册为开机自启的服务(WinSW实现)
运维·windows·nginx
LSL666_2 天前
云服务上安装nginx
java·运维·nginx