close wait 问题学习

为什么会出现close wait

数据库连接不释放 问题实际上上线之前就会发现,线上系统出这种问题根本就是测试不过关。

我之前也遇到过出现很多CLOSE_WAIT的场景,一般出现这种情况,都是同步通信的场景,server端执行业务超时 ,client端主动断开连接的场景。

特别是一些写库的操作,随着表越来越大,写操作越来越慢,当慢到一定程序后会触发client端的超时再重试机制,越来越多的写操作积压在server端,很短的时间内server端被搞的socket全是CLOSE_WAIT,只能重启,重启也是好一段时间。

所以现在我们现在对同步通信机制一定要保证不能有不可预估的开销。这类开销一律走异步机制

实现负载均衡:通过实现负载均衡,将请求分发到多个服务器上,以分散负载并提高系统的吞吐量。负载均衡可以帮助避免单个服务器过载的情况发生。

调整应用程序逻辑:如果应用程序的逻辑不合理或存在性能瓶颈,可能会导致接口响应缓慢或超时。可以对应用程序逻辑进行调整或优化,以提高接口的响应速度和处理能力。

看着像啊,盲猜。负载均衡对外的链接数被限制了,比如port_range设置过小达不到65536这样。请求一直发,很容易就打满端口号,

这里提出两个思考题,我觉得非常有意义,大家自己思考下:

为什么一台机器几百个 CLOSE_WAIT 就导致不可继续访问?我们不是经常说一台机器有 65535 个文件描述符可用吗?

为什么我有负载均衡,而两台部署服务的机器确几乎同时出了 CLOSE_WAIT ?

看着像啊,盲猜。负载均衡对外的链接数被限制了,比如port_range设置过小达不到65536这样。请求一直发,很容易就打满端口号,

1.需要看最大连接数配置的是多少

2.业务问题导致的异常和负载均衡没关系,出问题肯定是都出问题

请问一下 ,socket 状态 监控工具用的是什么工具

相关推荐
勤劳的进取家16 小时前
应用层基础
运维·网络·学习
xian_wwq17 小时前
【学习笔记】储能系统的铁三角:BMS、PCS、EMS分别管啥
笔记·学习·储能系统
QiZhang | UESTC17 小时前
学习并复现minimind
学习
stm32 菜鸟17 小时前
nucleo-f411re学习记录-14,OTA 固件升级-bootloader与app分区实现
学习
Bechamz18 小时前
大数据开发学习Day24
大数据·学习
在下_诸葛18 小时前
langgraph学习笔记
笔记·python·学习·langgraph教程
charlie11451419118 小时前
现代Qt开发教程(新手篇)1.10——进程
开发语言·c++·qt·学习
绿豆人18 小时前
Cache缓存项目学习2
学习·缓存
山楂树の18 小时前
H.265 (HEVC) 视频解码转逐帧图像 完整实现方案
学习·音视频·h.265
星幻元宇VR18 小时前
VR观景台推动安全科普走向沉浸体验
科技·学习·安全·vr·虚拟现实