1、TCP重传机制

通过序列号和确认号确保可靠传输，当发送端发送数据给接收到，接收端会返回一个确认号，表示收到消息了

超时重传 ：没有在指定时间内收到ACK报文
- 超时重传的两种可能：数据包丢失 、确认包丢失
- 超时重传时间RTO:
  - RTO较大：重发就变慢了，丢包之后需要半天才能重发，效率低
  - RTO较小：可能没有丢包，还在等待ACK过程中，就重发了，会导致网络拥塞，进而导致更多的超时重发
  - 所以RTO需要略大于报文往返的时间RTT(数据发送到接收到ACK的时间差)
- 由于网络波动问题，RTT可能不是固定的，所以RTO对应也不是固定的
- 一般超时重传一次，下一次超时重传的间隔会加倍，避免网络环境差的频繁发送
快速重传 ：
- 超时重传的问题：重传周期可能很长(时间会加倍)，快速重传可以解决这个问题，以数据为驱动作为重传
- 发送了数据包seq1~seq5,
  - 发送端发送seq1，接收端回复ack=2，表示接收到包1
  - seq2丢失
  - 发送端连续发送seq3~seq5，接收端会重复返回ack=2
  - 连续三次ack=2，触发快速重传，重复seq2
  - 由于接收到了seq3~seq5，发送端会返回ack=6
- 快速重传只解决了超时问题，但是还有一个问题：重传的时候重传一个还是所有数据包
- 因为如果只重传一个，当有两个数据包丢失的时候，需要判断两次返回的ack(三次重复)，来进行单包重传，效率低
- 如果重传所有，就会有多余的包被重新发送，无用功
SACK ：选择性确认,可以知道哪些数据丢失了
- 需要TCP头部选项字段中，添加一个SACK，可以将已接收到的数据的信息发送给发送方，发送方就知道了哪些数据丢失了，从而只发送丢失的数据
- 在快速重传的基础上，发送方收到三次相同的ack报文，触发快速重传机制，通过SACK信息可以知道哪段数据丢失了，只对丢失的数据重传
D-SACK：通过SACK告诉发送端哪些数据被重复接收了
- 可以让发送端知道是包丢失，还是ACK包丢失了
- 可以知道发送的数据包是不是被网络延迟了
- 可以知道网络中是不是把发送端的数据包给复制了
小结：
- 如果数据包丢失或者ACK包丢失，超过一定时间会触发超时重传，超时时间RTO略大于RTT时间(发送数据到接收ACK包的时间间隔)
- 为了解决超时等待的时间，提高效率，就有了快速重传，当有一个包丢失的时候，可以通过判断重复的ack进行快速重传，通过在TCP头部的选项字段里面添加SACK，就可以知道哪些包是丢失的，从而只重传丢失的包
- 如果在ACK包丢失，导致的超时重传，发送端接收到接收端SACK从而知道收到了重复数据，这个SACK就是D-SACK，如果一个包由于网络问题导致的快速重传，也可以通过D-SACK来进行判断

2、TCP滑动窗口

TCP每次发送数据都要进行确认应答，当上一个包收到应答了再发下一个

如果是一问一答的形式，则数据包往返的时间周期越长，通信效率就越低
为了解决上面的问题，就有窗口概念，
- 可以指定窗口大小，窗口大小是不需要等待确认应答，可以继续发送数据的最大值
- 窗口是内核里面开辟的缓存区，需要保留发送的数据，只有收到应答才会从缓冲区中删除
- 在TCP头部可以指定窗口大小，发送端会根据ACK返回的窗口大小，来发送数据，从而保证对端可以正常接收数据，所以窗口大小是由接收端决定的
发送端的窗口 ：
- 有两个绝对指针：一个指向没有收到ack的第一个字节的序列号，一个指向窗口中可用空间的第一个字节的序列号
- 会根据ACK报文中的窗口大小进行调整，因为应用层不一定及时收数据
- 此外，如果发送端窗口满了，没有及时收到ACK，就不能在应用层进行发送数据，如果序列号较前的收到ack，窗口会向右移动，存在可发空间，应用层可以继续拷贝发送数据
接收端的窗口 ：可以接收发送端发送的数据量，一次能处理的数据量
- 只有一个绝对指针，指向期望对端发送来的下一个字节的序列号
- 窗口里面是还没进行确认的数据，也就是还没收到的数据，但是可以接收的数据大小
发送端窗口约等于接收端窗口，因为传输存在延迟，不一定及时调整窗口大小，所以是约等于
小结：
- 三次握手确定窗口大小，接收端能接收多少数据，发送端根据接收端数据进行调整，去发送数据，在发送端窗口大小内，发送端可以一直发，并等待接收端返回ack确认号来发送窗口移动，每次ack报文都会携带窗口大小，可能会改变；

3、TCP流量控制

利用滑动窗口实现流量控制，发送端不能一股脑的发过去，如果对方处理不过来就会触发重传机制

流量控制：发送方根据接收方的实际接收能力发送数据，也就是接收端滑动窗口的大小
TCP内核缓冲区和滑动窗口的关系 ：缓冲区大小会影响窗口大小
- 应用层不及时收取数据，会导致窗口变小：
  - TCP滑动窗口(指针实现)是处于TCP缓冲区中间的，如果接收端接收到数据并返回ACK，但是应用层没有及时收取 ，当缓冲区内存不够，可能会导致滑动窗口变小，当窗口大小变成0，就发生了窗口关闭
- 系统资源减少，会导致缓冲区变小：
  - 如果用户空间没有及时读取缓冲区数据，并且接收缓冲区由于系统资源突然变小，发送端来不及调整，会导致数据丢包现象，这是因为先减少缓冲区再收缩窗口
  - 所以不允许同时减少缓冲又收缩窗口，而先收缩窗口后一段时间再减少缓冲，从而避免丢包
窗口关闭 ：
- 窗口大小为0的情况，就会阻止发送端发送数据，直到大小变成非0
- 如果接收端窗口变成非0，会通过发送携带窗口大小的ACK报文，如果ACK报文丢失，发送端会一直等待，造成死锁问题
- 如何避免死锁问题：当窗口关闭，就会启动一个持续计时器，如果超时就会发送一个窗口探测报文，接收端收到这个报文，就会返回一个携带当前窗口大小的ACK报文，如果窗口依旧为0，就会重启持续计时器
糊涂窗口综合症
- 接收端太忙，会导致发送端的窗口越来越小，到最后只有接收端腾出字节空间，发送端就会马上发送，但是TCP/IP包头就有40字节，有数据就传输的话，开销太大了
- 导致的原因是：
  - 接收端告知小窗口大小
  - 发送端发送小数据
- 如何避免：
  - 接收方不告知小窗口，窗口小于某个值就发送窗口为0的ACK，阻止对端发送数据
  - 发送发避免发送小数据，开启Nagle算法，避免小包发送
Nagle算法思想，延时处理，满足下面一个条件即可：
- 窗口大小>=MSS并且数据大小>=MSS
- 收到前一个数据的ack报文
一般需要搭配不通知小窗口给发送方+开启Nagle算法才能避免糊涂窗口综合症

4、TCP拥塞控制

流量控制：是为了避免，发送端数据填满接收端的缓存，但是流量控制并不知道网络中发送的情况
网络拥塞：网络发生拥堵的时候，继续发送大量数据包，就可能导致数据包延时、丢失等情况，TCP就会重传数据，一旦重传就会导致网络更加拥堵，从而不断恶性循环
拥塞控制 ：避免发送方的数据填满整个网络 ，并且为了调节发送数据的量，定义了一个拥塞窗口(cwnd)的概念
拥塞窗口(cwnd) ：是发送方维护的一个状态变量，会根据网络的拥塞程度进行变化，滑动的发送窗口=min(滑动的接收窗口，拥塞窗口)，当网络没有出现拥塞，cwnd窗口就会越大，当网络出现拥塞，cwnd就会越小
如何判断网络拥塞：发送方没有在指定时间接收到ACK应答报文，也就是发送超时重传，就会认为网络出现拥塞了
拥塞控制主要是四算法：
- 慢启动 ：(指数增长)
  - TCP建立连接后，一点点点提高数据包发送的数量，发送端没收到一个ACK,拥塞窗口cwnd的大小就会+1;
  - 存在一个慢启动门限ssthresh，如果cwnd<ssthresh使用的就是慢启动算法，如果cwnd>=ssthresh，就使用拥塞避免算法；ssthresh一般大小为65535字节
- 拥塞避免 ：
  - 没收到一个ACK，cwnd增加1/cwnd，是为了确保cwnd的线性增长
  - 如果一直保持增长，网络就会慢慢进入拥塞状态，从而出现了丢包现象
  - 如果触发了重传机制，就会进入拥塞发生算法
- 拥塞发送 ：
  - 发生重传(超时、快速)的时候就会进入拥塞发生算法
  - 超时重传的拥塞发生：
    - ssthresh会设置为cwnd/2,并且cwnd会回复为初始值，linux的初始值是10(10个MSS)；
    - 设置完ssthresh和cwnd之后，会重新开始慢启动；
    - 这种方式下来的拥塞发生太激进了，容易造成网络卡顿
  - 快速重传的拥塞发生：
    - 设置cwnd为cwnd/2，再设置ssthresh为cwnd
    - 设置完之后，会进入快速回复算法
- 快速回复 ：
  - 当发生快速重传的时候，表示网络不是太糟糕，一般快速回复和快速重传同时使用
  - 进入快速回复前， cwnd和ssthresh都全部设置完了
  - 快速回复：
    - cwnd = ssthresh+3，3表示接收到了三个数据包
    - 重传丢失的数据包;
    - 如果再收到重复的ACK，cwnd就+1
    - 如果收到的是新的ACK，表示网络没问题了，则将cwnd设置为ssthresh，进入拥塞避免状态；
拥塞控制算法过程：
- 从TCP三次握手建立连接开始，发送端开始慢启动，没收到一个包的ACK，拥塞窗口就会+1，如果达到阈值，就会进入拥塞避免算法，每收到一个包的ACK，拥塞窗口就会增加窗口的倒数，从而保证拥塞窗口的线性增加
- 当遇到丢包的情况，就判断为网络拥塞，从而重复重传机制，进入拥塞发送算法，根据重传机制的不同，拥塞发送算法也会不同
- 超时重传，sthresh=cwnd/2,并且cwnd=初始值，重新重慢启动开始
- 快速重传，cwnd=cwnd/2，ssthresh=cwnd，开启快速回复
- 快速回复：先是设置cwnd=ssthresh+3，并重传丢失数据包，如果依旧重复收到相同的ACK，就会重复触发快速重传和快速回复，如果收到的是新的数据包，则进入拥塞避免状态。

参考文章：小林coding

网络编程(12): TCP重传、滑动窗口、流量控制、拥塞控制

1、TCP重传机制

2、TCP滑动窗口

3、TCP流量控制

4、TCP拥塞控制