Nginx 转发 404 问题的排查和思考

本篇文章原自当前业务遇到的一个实际问题,因为受到所在网络环境的因素影响,所以整体排查下来耗费了很大精力,记录一下。

项目背景

项目是 toG 项目,部署的网络环境是一个大的内网环境(又具体分为内网和内网互联网区),项目涉及到小程序、前端、后端(又包括 JAVA 和 GO 两个项目)的部署。整体的部署拓扑图大致如下:

虚拟 IP 映射:大多数内网如何需要暴露对外访问,会在出口的核心路由上配置一个虚拟的 IP 作为对外的统一访问入口。比如你的内网地址及端口是 10.13.3.177:8080,则通过虚拟 IP 映射的地址及端口可能是:10.31.31.253:8080。

在这个业务流程程,访问路径是:公网(小程序前台)-> 内网互联网区【10.31.1.142(nginx + 小程序后台)】 -> 【10.31.31.253 -> 10.13.3.177(nginx+后端)】 -> 【10.233.1.2 -> 172.13.7.249(nginx+后端)】。其中 10.13.3.177 和 172.13.7.249 是两台虚拟机,虚拟机上部署了nginx 和 后端服务。

PS:上述所有的 IP 均已做过处理,非正式 IP。

问题

访问步骤及问题节点:

  • 1、小程序访小程序后台服务
  • 2、小程序后台服务发起调用到 10.31.31.253(这里实际上是 10.31.1.142 要调用 10.233.1.2 的服务,因为 10.31.1.142 不能直接访问 10.233.1.2,所以借用 10.31.31.253 来实现一层转发逻辑)。

这里会涉及到两个转发,

  • 10.31.31.253 对应的 10.13.3.177 这台机器上的 nginx 需要将 10.31.1.142 的请求转发给 10.233.1.2
  • 10.233.1.2 对应的 nginx 需要将请求到当前机器的后台服务上

在转发时通过 10.31.31.253 调用 10.233.1.2 时出现 404,10.233.1.2 调用本机后端服务时也出现 404;还有一个 502 是 10.31.1.142 访问 10.31.31.253 出现的。下面是分析问题的大体过程和解决办法。

因端口映射导致的访问 502 问题

前面提到 10.31.31.25310.233.1.2 均是 虚拟 IP ,10.31.31.253:8805 端口映射到虚拟机 10.13.3.177 上的端口是 18805,10.13.3.177 上 nginx 配置的监听端口是 18805,所以 10.31.1.142 在访问的第一跳是 10.31.31.253:8805,但在实际排查中发现, 10.31.1.142 访问的是 10.31.31.253:18805,所以出现 502 问题。

状态码 502 表示 HTTP 协议中的 "Bad Gateway",通常用于表示服务器作为网关或代理时遇到了问题。这个错误通常会在一个服务器作为中介时,无法从另一个服务器获取有效响应以满足客户端请求时出现。

proxy_pass 转发 url 丢弃路径导致的 404 问题

根据前面的背景,实际上两个 404 问题均是因为这个原因导致。10.31.1.142 发起的请求是 10.31.31.253:8805/miniapp/user/case, nginx access.log 的日志如下:

java 复制代码
"POST /miniapp/user/case HTTP/1.1" 404 153 "-" "Java/1.8.0_351"
"POST /miniapp/user/case HTTP/1.1" 404 153 "-" "Java/1.8.0_351"
"POST /miniapp/user/case HTTP/1.1" 404 153 "-" "Java/1.8.0_351"

因为这个请求不是 10.31.31.253 对应的 10.13.3.177 这台机器上的服务处理,而是直接转发给 10.233.1.2 对应的 172.13.7.249 机器的,因此这里出现 404,因为是转发到 172.13.7.249 时没有找到相应的资源。查看 249 机器上的 nginx 访问日志

java 复制代码
"POST /user/case HTTP/1.0" 404 153 "-" "Java/1.8.0_351"
"POST /user/case HTTP/1.0" 404 153 "-" "Java/1.8.0_351"
"POST /user/case HTTP/1.0" 404 153 "-" "Java/1.8.0_351"

可以看到, 249 这台机器上的请求变成了 /user/case,丢失了 /miniapp 这个 prefix,10.13.3.177 机器的 nginx 配置如下:

java 复制代码
location /miniapp/ {
    // 主要是这里
    proxy_pass http://10.31.31.253:8805/;
}

关于这个问题,解决方案大致有如下几种(来源各种技术文章):

  • 1、修改代理配置:将匹配以 /miniapp 开头的所有请求,并将它们代理到 10.31.31.253:8805,保持请求 URI 不变。
java 复制代码
location /miniapp {
    proxy_pass http://10.31.31.253:8805;
}
  • 2、使用正则表达式捕获和重写 URI:捕获以 /miniapp 开头的请求,并将 /miniapp 后面的部分传递给后端服务器。
java 复制代码
location ~ ^/miniapp(/.*)$ {
    proxy_pass http://10.31.31.253$1;
}
  • 3、rewrite 重写:使用 rewrite 指令将 /miniapp 后面的部分提取出来,然后将其传递给后端服务器
java 复制代码
location /miniapp/ {
    rewrite ^/miniapp(/.*)$ $1 break;
    proxy_pass http://10.31.31.253;
}
  • 4、保留 location 前缀:就是将 location 前缀保留在 proxy_pass 的后面
java 复制代码
location /miniapp/ {
    proxy_pass http://10.31.31.253:8805/miniapp/;
}

经测试,方案 1 和 方案 4 是可以解决 404 问题的。其中方案 4 是**有病治病的逻辑,转发丢弃则就加上。**这两个问题对于了解 nginx proxy_pass 配置的同学来说应该一眼就可以看到问题所在,但是 大多数时候,我们会忽略那些看起来并不是很显眼的东西,比如 /

proxy_pass 配置以 / 结尾和不以 / 结尾的区别

  • 以 / 结尾的proxy_pass配置
java 复制代码
location /miniapp/ {
    proxy_pass http://10.31.31.253:8805/;
}

这种配置方式以斜杠 / 结尾,意味着 Nginx 会将原始请求的 URI 与 proxy_pass 后面的 URI 拼接在一起,并将最终的请求发送到后端服务器。例如,如果原始请求是 http://10.31.1.142 /miniapp/user/case,那么 Nginx会将它代理到 http://10.31.31.253:8805/user/case。

  • 不以 / 结尾的proxy_pass配置
java 复制代码
location /miniapp/ {
    proxy_pass http://10.31.31.253:8805;
}

这种配置方式没有斜杠 / 结尾,意味着 Nginx 会将原始请求的 URI 原封不动 地传递给后端服务器。例如,如果原始请求是 http://10.31.1.142/miniapp/user/case,那么 Nginx 会将它代理到http://10.31.31.253:8805/miniapp/user/case。

所以说,如果你希望将请求映射到后端服务器的根目录,则可以使用以斜杠 / 结尾的配置。如果你希望保持URI不变,可以使用不以 / 结尾的配置。

关于 proxy_pass 以及 location

网上关于这两个介绍的文章非常多,本篇不做过多的阐述。

小结

问题其实不是很复杂,主要还是对于 nginx 的一些配置作用不大清楚,另外就是在实际排查过程中,因为链路和网络环境问题走了很多弯路;但是如果把这些信息梳理清楚了,就会拨云见日;问题就在那里,复杂的是过程

相关推荐
ZzT42 分钟前
怎么做才不会被 AI 替代?
人工智能·程序员
烬羽2 小时前
你真的理解 LLM 的"无状态"吗?从一段代码讲起
程序员
AskHarries4 小时前
把一个外部系统接成 MCP 工具
后端·程序员
threerocks5 小时前
AI编程的商业模式已经在互联网大厂跑通了
程序员·aigc·ai编程
用户526835677905 小时前
云原生落地:如何配置 Alertmanager 插件,将 Prometheus 告警直接打通至硬件声光语音终端?
程序员
用户852495071845 小时前
我跟 AI 说了名字它转头就忘,后来我手动给它加了个"记忆"
程序员
zzzzzz3105 小时前
当甲方说'logo放大的同时再缩小一点'时,我用 AI 把这个需求做出来了
javascript·css·程序员
Hilaku5 小时前
Node.js 还能再战十年?给你一个不换引擎的理由
前端·javascript·程序员
Hyyy17 小时前
token是什么?为什么大模型会有上下文长度的限制
程序员·llm·ai编程
SelectDB21 小时前
Litefuse 开源并推出单进程轻量模式,25 秒就能跑起来的 Agent 可观测与评估平台
运维·后端·自动化运维