Linux-TCP重传

问题描述:

应用系统进行切换,包含业务流量切换(即TongWeb主备切换)和MYSQL数据库主备切换。首先进行流量切换,然后进行数据库主备切换。切换后发现备机TongWeb上有两批次慢请求,第一批慢请求响应时间在133秒左右,第二批次在966秒左右。

慢请求原因:

第一批慢请求原因:数据库主备切换时DNS还未就绪,此时又需要新建数据库连接,连接创建在旧主库上,由于旧主库已无法使用,所以从TCP上看连接状态一直处于SYN_SENT状态。因为连不上数据库,根据tcp_syn_retries参数设置,会不断地向数据库重传数据,直到达到阈值放弃连接。然后会重新建连,连接到新的主库,从而将业务执行完毕。此处耗时在于TCP重传,重传时间见参数tcp_syn_retries说明。

第二批慢请求原因:数据库主备切换时,此时业务已经从连接池中获取了连接并进行了数据库操作,这个时候数据库又无法使用,从TCP上看连接状态是ESTABLISHED状态。因为连不上数据库,根据tcp_retries2参数设置,会不断地向数据库重传数据,直到达到阈值放弃连接。然后会重新建连,连接到新的主库,从而将业务执行完毕。此处耗时在于TCP重传,重传时间见参数tcp_retries2说明。

根据MYSQL代码说明,在代码中捕获SQLException,当检测到特定的断开错误码(如2006或2013)时,尝试重新连接。

2006:MySQL服务器正在运行,但是客户端无法连接到服务器。

2013:客户端在等待来自服务器的响应时超时。

TCP 重传参数:

1 、net.ipv4.tcp_syn_retries

该参数默认值为6。主机作为客户端,对外发起TCP连接时,即三次握手的第一步,内核发送SYN报文的重试次数,超过这个次数后放弃连接。

通常,第一次超时重传是在1秒后,第二次超时重传是在2秒,第三次超时重传是在4秒后,第四次超时重传是在8秒后,每次超时的时间是上一次的2倍,最后一次重传后会继续等待上一次的2倍。

2 、net.ipv4.tcp_synack_retries

该参数默认值为5。主机作为服务端,接受TCP连接时,在三次握手的第二步,向客户端发送SYN+ACK报文的重试次数,超过这个次数后放弃连接。

与客户端重传SYN类似,它的重传会经历1、2、4、8、16秒,最后一次重传后会继续等待32秒,如果服务端仍然没有收到ACK,才会关闭连接,故共需要等待63秒。

3 、net.ipv4.tcp_retries1

该参数用于设置TCP连接中数据包轻量级重试的次数,默认值通常为3。

当TCP向接收方发送数据包时,它会等待接收方确认已经收到数据包。如果在一定时间内没有收到确认(ACK),TCP将尝试重新发送数据包。该参数指定了在将连接视为有问题之前,TCP应该重试发送未确认数据包的次数。

4 、net.ipv4.tcp_retries2

该参数用于设置TCP连接中数据包的最大重试次数,默认值通常为15。

在TCP通信过程中,发送方会等待接收方确认已收到数据包。如果在一定时间内没有收到确认(ACK),发送方会尝试重新发送数据包。在经过一定次数的轻量级重试之后(由net.ipv4.tcp_retries1参数指定),连接可能被认为存在问题。

在认为连接有问题之后,TCP将尝试再进行15次重试,然后放弃并关闭连接。这些重试次数包括了net.ipv4.tcp_retries1参数定义的轻量级重试次数。

相关推荐
Johny_Zhao9 小时前
centos7安装部署openclaw
linux·人工智能·信息安全·云计算·yum源·系统运维·openclaw
haibindev10 小时前
在 Windows+WSL2 上部署 OpenClaw AI员工的实践与踩坑
linux·wsl2·openclaw
0xDevNull2 天前
Linux切换JDK版本详细教程
linux
进击的丸子2 天前
虹软人脸服务器版SDK(Linux/ARM Pro)多线程调用及性能优化
linux·数据库·后端
Johny_Zhao3 天前
OpenClaw安装部署教程
linux·人工智能·ai·云计算·系统运维·openclaw
blasit3 天前
笔记:Qt C++建立子线程做一个socket TCP常连接通信
c++·qt·tcp/ip
chlk1235 天前
Linux文件权限完全图解:读懂 ls -l 和 chmod 755 背后的秘密
linux·操作系统
舒一笑5 天前
Ubuntu系统安装CodeX出现问题
linux·后端
改一下配置文件5 天前
Ubuntu24.04安装NVIDIA驱动完整指南(含Secure Boot解决方案)
linux