1、TCP重传机制
通过序列号和确认号确保可靠传输,当发送端发送数据给接收到,接收端会返回一个确认号,表示收到消息了
- 超时重传 :没有在指定时间内收到
ACK
报文- 超时重传的两种可能:数据包丢失 、确认包丢失
- 超时重传时间
RTO
:RTO
较大:重发就变慢了,丢包之后需要半天才能重发,效率低RTO
较小:可能没有丢包,还在等待ACK过程中,就重发了,会导致网络拥塞,进而导致更多的超时重发- 所以
RTO
需要略大于报文往返的时间RTT
(数据发送到接收到ACK的时间差)
- 由于网络波动问题,
RTT
可能不是固定的,所以RTO
对应也不是固定的 - 一般超时重传一次,下一次超时重传的间隔会加倍,避免网络环境差的频繁发送
- 快速重传 :
超时重传的问题
:重传周期可能很长(时间会加倍),快速重传可以解决这个问题,以数据为驱动作为重传- 发送了数据包
seq1
~seq5
,- 发送端发送
seq1
,接收端回复ack=2
,表示接收到包1 seq2
丢失- 发送端连续发送
seq3
~seq5
,接收端会重复返回ack=2
- 连续三次
ack=2
,触发快速重传
,重复seq2
- 由于接收到了
seq3
~seq5
,发送端会返回ack=6
- 发送端发送
- 快速重传只解决了超时问题,但是还有一个问题:重传的时候重传一个还是所有数据包
- 因为如果只重传一个,当有两个数据包丢失的时候,需要判断两次返回的ack(三次重复),来进行单包重传,效率低
- 如果重传所有,就会有多余的包被重新发送,无用功
- SACK :选择性确认,可以知道哪些数据丢失了
- 需要
TCP
头部选项
字段中,添加一个SACK
,可以将已接收到的数据的信息发送给发送方,发送方就知道了哪些数据丢失了,从而只发送丢失的数据 - 在快速重传的基础上,发送方收到三次相同的ack报文,触发快速重传机制,通过
SACK
信息可以知道哪段数据丢失了,只对丢失的数据重传
- 需要
D-SACK
:通过SACK
告诉发送端哪些数据被重复接收了- 可以让发送端知道是包丢失,还是ACK包丢失了
- 可以知道发送的数据包是不是被网络延迟了
- 可以知道网络中是不是把发送端的数据包给复制了
- 小结:
- 如果数据包丢失或者ACK包丢失,超过一定时间会触发超时重传,超时时间
RTO
略大于RTT
时间(发送数据到接收ACK包的时间间隔) - 为了解决超时等待的时间,提高效率,就有了快速重传,当有一个包丢失的时候,可以通过判断重复的ack进行快速重传,通过在TCP头部的选项字段里面添加SACK,就可以知道哪些包是丢失的,从而只重传丢失的包
- 如果在
ACK
包丢失,导致的超时重传,发送端接收到接收端SACK
从而知道收到了重复数据,这个SACK
就是D-SACK
,如果一个包由于网络问题导致的快速重传,也可以通过D-SACK
来进行判断
- 如果数据包丢失或者ACK包丢失,超过一定时间会触发超时重传,超时时间
2、TCP滑动窗口
TCP每次发送数据都要进行确认应答,当上一个包收到应答了再发下一个
- 如果是一问一答的形式,则数据包往返的时间周期越长,通信效率就越低
- 为了解决上面的问题,就有窗口概念,
- 可以指定窗口大小,窗口大小是不需要等待确认应答,可以继续发送数据的最大值
- 窗口是内核里面开辟的缓存区,需要保留发送的数据,只有收到应答才会从缓冲区中删除
- 在
TCP头部
可以指定窗口大小,发送端会根据ACK
返回的窗口大小,来发送数据,从而保证对端可以正常接收数据,所以窗口大小是由接收端决定的
- 发送端的窗口 :
- 有两个绝对指针:一个指向没有收到ack的第一个字节的序列号, 一个指向窗口中可用空间的第一个字节的序列号
- 会根据ACK报文中的窗口大小进行调整,因为应用层不一定及时收数据
- 此外,如果发送端窗口满了,没有及时收到
ACK
,就不能在应用层进行发送数据,如果序列号较前的收到ack,窗口会向右移动,存在可发空间,应用层可以继续拷贝发送数据
- 接收端的窗口 :可以接收发送端发送的数据量,一次能处理的数据量
- 只有一个绝对指针,指向期望对端发送来的下一个字节的序列号
- 窗口里面是还没进行确认的数据,也就是还没收到的数据,但是可以接收的数据大小
- 发送端窗口约等于接收端窗口,因为传输存在延迟,不一定及时调整窗口大小,所以是约等于
- 小结:
- 三次握手确定窗口大小,接收端能接收多少数据,发送端根据接收端数据进行调整,去发送数据,在发送端窗口大小内,发送端可以一直发,并等待接收端返回ack确认号来发送窗口移动,每次ack报文都会携带窗口大小,可能会改变;
3、TCP流量控制
利用滑动窗口实现流量控制,发送端不能一股脑的发过去,如果对方处理不过来就会触发重传机制
- 流量控制:发送方 根据 接收方的实际接收能力发送数据,也就是接收端滑动窗口的大小
- TCP内核缓冲区和滑动窗口的关系 :缓冲区大小会影响窗口大小
- 应用层不及时收取数据,会导致窗口变小:
- TCP滑动窗口(指针实现)是处于TCP缓冲区中间的,如果接收端接收到数据并返回ACK,但是应用层没有及时收取 ,当缓冲区内存不够,可能会导致滑动窗口变小,当窗口大小变成0,就发生了窗口关闭
- 系统资源减少,会导致缓冲区变小:
- 如果用户空间没有及时读取缓冲区数据,并且接收缓冲区由于系统资源突然变小,发送端来不及调整,会导致数据丢包现象,这是因为先减少缓冲区再收缩窗口
- 所以不允许同时减少缓冲又收缩窗口,而先收缩窗口后一段时间再减少缓冲,从而避免丢包
- 应用层不及时收取数据,会导致窗口变小:
- 窗口关闭 :
- 窗口大小为0的情况,就会阻止发送端发送数据,直到大小变成非0
- 如果接收端窗口变成非0,会通过发送携带窗口大小的ACK报文,如果ACK报文丢失,发送端会一直等待,造成死锁问题
- 如何避免死锁问题:当窗口关闭,就会启动一个持续计时器,如果超时就会发送一个
窗口探测报文
,接收端收到这个报文,就会返回一个携带当前窗口大小的ACK报文,如果窗口依旧为0,就会重启持续计时器
- 糊涂窗口综合症
- 接收端太忙,会导致发送端的窗口越来越小,到最后只有接收端腾出字节空间,发送端就会马上发送,但是TCP/IP包头就有40字节,有数据就传输的话,开销太大了
- 导致的原因是:
- 接收端告知小窗口大小
- 发送端发送小数据
- 如何避免:
- 接收方不告知小窗口,窗口小于某个值就发送窗口为0的ACK,阻止对端发送数据
- 发送发避免发送小数据,开启Nagle算法,避免小包发送
- Nagle算法思想,延时处理,满足下面一个条件即可:
- 窗口大小>=MSS并且数据大小>=MSS
- 收到前一个数据的ack报文
- 一般需要搭配 不通知小窗口给发送方+开启Nagle算法才能避免糊涂窗口综合症
4、TCP拥塞控制
-
流量控制:是为了避免,发送端 数据填满 接收端的缓存,但是流量控制并不知道网络中发送的情况
-
网络拥塞:网络发生拥堵的时候,继续发送大量数据包,就可能导致数据包延时、丢失等情况,TCP就会重传数据,一旦重传就会导致网络更加拥堵,从而不断恶性循环
-
拥塞控制 :避免发送方的数据填满整个网络 ,并且为了调节发送数据的量,定义了一个
拥塞窗口(cwnd)
的概念 -
拥塞窗口(cwnd) :是发送方维护的一个状态变量,会根据网络的拥塞程度进行变化,滑动的发送窗口=min(滑动的接收窗口,拥塞窗口),当网络没有出现拥塞,
cwnd
窗口就会越大,当网络出现拥塞,cwnd
就会越小 -
如何判断网络拥塞:发送方没有在指定时间接收到ACK应答报文,也就是发送超时重传,就会认为网络出现拥塞了
-
拥塞控制主要是四算法:
- 慢启动 :(指数增长)
- TCP建立连接后,一点点点提高数据包发送的数量,发送端没收到一个ACK,拥塞窗口
cwnd
的大小就会+1; - 存在一个慢启动门限
ssthresh
,如果cwnd
<ssthresh
使用的就是慢启动算法,如果cwnd
>=ssthresh
,就使用拥塞避免算法;ssthresh
一般大小为65535字节
- TCP建立连接后,一点点点提高数据包发送的数量,发送端没收到一个ACK,拥塞窗口
- 拥塞避免 :
- 没收到一个ACK,
cwnd
增加1/cwnd
,是为了确保cwnd
的线性增长 - 如果一直保持增长,网络就会慢慢进入拥塞状态,从而出现了丢包现象
- 如果触发了重传机制,就会进入拥塞发生算法
- 没收到一个ACK,
- 拥塞发送 :
- 发生重传(超时、快速)的时候就会进入拥塞发生算法
- 超时重传的拥塞发生:
ssthresh
会设置为cwnd/2
,并且cwnd
会回复为初始值,linux的初始值是10(10个MSS);- 设置完
ssthresh
和cwnd
之后,会重新开始慢启动; - 这种方式下来的拥塞发生太激进了,容易造成网络卡顿
- 快速重传的拥塞发生:
- 设置
cwnd
为cwnd/2
,再设置ssthresh
为cwnd
- 设置完之后,会进入
快速回复算法
- 设置
- 快速回复 :
- 当发生快速重传的时候,表示网络不是太糟糕,一般快速回复和快速重传同时使用
- 进入快速回复前,
cwnd
和ssthresh
都全部设置完了 快速回复
:cwnd
=ssthresh+3
,3表示接收到了三个数据包- 重传丢失的数据包;
- 如果再收到重复的
ACK
,cwnd
就+1 - 如果收到的是新的ACK,表示网络没问题了,则将cwnd设置为ssthresh,进入拥塞避免状态;
- 慢启动 :(指数增长)
-
拥塞控制算法过程:
- 从TCP三次握手建立连接开始,发送端开始慢启动,没收到一个包的ACK,拥塞窗口就会+1,如果达到阈值,就会进入拥塞避免算法,每收到一个包的ACK,拥塞窗口就会增加窗口的倒数,从而保证拥塞窗口的线性增加
- 当遇到丢包的情况,就判断为网络拥塞,从而重复重传机制,进入拥塞发送算法,根据重传机制的不同,拥塞发送算法也会不同
- 超时重传,sthresh=cwnd/2,并且cwnd=初始值,重新重慢启动开始
- 快速重传,cwnd=cwnd/2,ssthresh=cwnd,开启快速回复
- 快速回复:先是设置cwnd=ssthresh+3,并重传丢失数据包,如果依旧重复收到相同的ACK,就会重复触发快速重传和快速回复,如果收到的是新的数据包,则进入拥塞避免状态。