故障复盘:前置机双网卡导致的路由冲突(XX医院院,偶发网络连接不上,路由网卡随机导致)

故障复盘:前置机双网卡导致的路由冲突(XX医院院,偶发网络连接不上,因为路由网卡随机导致)

  1. 故障现象
    应用层表现:Nginx 日志报错 upstream timed out (10060),业务无法正常访问后端服务。
    网络层表现:作为调试入口的前置机,无法 ping 通目标服务器网址,且 tracert 后端IP 第一跳即超时。
  2. 根因分析
    环境背景:前置机配置了双网卡(双 IP),同时连接了内网(10.11.10.x)和外网/业务网(192.168.9.x)。
    冲突点:路由表中存在两条默认路由(0.0.0.0),分别指向两个不同的网关,且优先级(跃点数)相同。
    故障逻辑:
    前置机尝试访问服务器网址。
    Windows 系统在两条路由间"摇摆",随机选择了一条路径。
    当数据包被错误地发往内网网关(10.11.10.1)时,内网网关无法转发去往公网/业务网 IP 的流量,直接丢弃。
    导致前置机与后端网络不通,进而引发 Nginx 连接超时。
  3. 解决步骤(在前置机上执行)
    通过管理员权限的 CMD,手动修正路由表,强制"内外网分流"。
    清除旧配置
    删除所有冲突的默认路由,防止系统继续"掷骰子"。
    查看路由表信息
    cmd(超级管理员模式)
    route print -4 ------后面的命令可以用这个的结果发给AI,让AI帮完善,防止写错IP
    cmd(超级管理员模式)
    route delete 0.0.0.0
    指定外网出口(高优先级)
    强制所有互联网/业务网流量走 192.168.9.1 网关。
    cmd(超级管理员模式)
    route add -p 0.0.0.0 mask 0.0.0.0 192.168.9.1 metric 10
    指定内网出口(低优先级)
    强制内网流量(10.x.x.x)走 10.11.10.1 网关。
    cmd(超级管理员模式)
    route add -p 10.0.0.0 mask 255.0.0.0 10.11.10.1 metric 20
  4. 最终结论
    这是一次典型的客户端(前置机)网络配置不当引发的"假性"服务端故障。
    误区:看到 Nginx 报错 upstream timed out,容易误以为是后端服务挂了或服务器防火墙拦截。
    真相:后端服务正常,防火墙正常。问题出在发起请求的源头(前置机)因为双网卡路由冲突,导致请求包"迷路"被丢弃。
    建议:如果这台前置机是团队共用的跳板机,建议检查其他同事的电脑是否也有类似的双网卡配置,避免类似问题再次发生。
相关推荐
難釋懷6 小时前
Nginx对客户端的限制
运维·nginx
楠目8 小时前
CVE-2017-7529 Nginx Range头整数溢出漏洞利用总结
运维·nginx
難釋懷12 小时前
Nginx缓冲区
前端·javascript·nginx
ElevenS_it1881 天前
Nginx日志监控告警实战:access_log解析+5xx突增+慢请求+异常IP自动告警完整方案(Filebeat+Zabbix)
运维·网络·tcp/ip·nginx·zabbix
半夜燃烧的香烟1 天前
docker 安装minio nginx,配置nginx根据文根路由minio展示图片
java·nginx·docker
火山上的企鹅1 天前
Codex实战:APP远程升级服务搭建(二)阿里云ECS部署Node升级服务_Ubuntu_systemd_Nginx
nginx·ubuntu·阿里云·qgc
難釋懷2 天前
Nginx-UpStream工作流程
运维·nginx
難釋懷2 天前
Nginx-AB安装
运维·nginx
回忆2012初秋2 天前
【Nginx】原理、配置与运维实战(2)
运维·nginx·策略模式
阿豪啊2 天前
记一次 Nginx 跨域配置踩坑与优化:从嵌套 If 报错到 Map 指令最佳实践
nginx