生产环境超时问题最佳实践-从timeout导致500错误获得

最近发现线上系统的一个功能出现500错误。该功能是调用外部服务(内含把一个文件传给另一个平台),用同样文件,测试环境下测试可以,线上环境不行。先记录解决思路如下:

1、比较环境:测试环境和线上环境环境都是--前端 -> nginx -> 应用服务器。基本没差别。

2、根据日志找原因:

2.1 开始看到org.springframework.web.servlet.DispatcherServlet.processDispatchResult(1044) -- Null ModelAndView returned to DispatcherServlet with name 'xxx-servlet': assuming HandlerAdapter completed request handling

以为是这个原因导致(分析是后台还没处理完,前端请求超时导致HandlerAdapter completed request handling),还专门用程序调试了调用上传文件这个服务。

2.2 后结合浏览器、各端层面,初步判定是超时。因为测试环境外部带宽大,而线上环境外部带宽很小(主要用于监管服务器状态)。

3、解决问题

按下图修改各端连接的超时参数解决问题:

实际过程:由于一开始没有画这个图,凭经验一个个修改测试,修改的先后顺序就是图中红色数字表示(其中(*)表示不存在超时)。每个步骤一个个试,实际是花了很久时间的。得到的经验如下:
超时问题最佳实践:通常生产环境比较复杂,当发生超时问题时,应首先画出该超时功能流转图--即从前到后把每个独立部署点相连,然后逐一检查各个点之间连接是否存在超时要控制,这样可一次性处理到位

相关推荐
实心儿儿1 分钟前
Linux —— 进程间通信 - 匿名管道
linux·运维·服务器
wgl66652010 分钟前
进程间通信
linux·运维·服务器
悠悠1213811 分钟前
从0到1掌握Ansible:让自动化运维不再是梦想
运维·自动化·ansible
璞华Purvar11 分钟前
VC PE投资管理系统选型的核心考量因素有哪些?(2026选型指南)
大数据·运维·人工智能
b55t4ck12 分钟前
Linux CVE-2026-31431(Copy Fail)漏洞深入复现分析(待完善).md
linux·运维·服务器
前端老曹13 分钟前
Linux 指令完整版
linux·运维·服务器
广州服务器托管15 分钟前
[2026.5.12][IT工坊]WIN11.26300.8376专业工作站版[PIIS]中简 深度优化
运维·人工智能·windows·计算机网络·可信计算技术
草莓熊Lotso21 分钟前
【Linux网络】从 0 到 1 实现高性能 UDP 聊天室:深入拆解 Linux 网络编程与线程池架构
linux·运维·服务器·网络·数据库·c++·udp
05候补工程师30 分钟前
ROS 2 入门:从零实现小海龟 (Turtlesim) 的手动控制与自动化绘圆
运维·经验分享·python·ubuntu·机器人·自动化
艾莉丝努力练剑32 分钟前
【Linux网络】Linux 网络编程:应用层自定义协议与序列化(2)序列化与反序列化
linux·运维·服务器·c++·网络协议·序列化