图解 TCP 拥塞控制

文章目录

什么是拥塞控制

拥塞控制是一种 确保网络中的数据包以可持续的速率传输 的机制,避免因为数据包太多而超过网络当前的承载能力,导致网络性能下降,甚至产生大量的丢包现象。

TCP 使用 端到端拥塞控制 而不是网络辅助的拥塞控制,因为 IP 层不向端系统提供显式的网络拥塞反馈。TCP 采用的方法是让每一个发送方根据 所感知到的网络拥塞程度 来限制向连接发送流量的速率。

运行在发送方的 TCP 拥塞控制机制需要跟踪一个额外的变量------拥塞窗口(congestion window),发送方未确认的数据量不会超过 cwnd(拥塞窗口) 与 rwnd(接收窗口) 中的最小值。

python 复制代码
# SND 为发送缓冲区, NEXT 下一个写入的字节编号, UNA 第一个已发送但未确认的字节编号
# NEXT - UNA 等于已发送但未确认的字节范围
SND.NEXT - SND.UNA <= min(cwnd, rwnd)

发送方如何感知网络的拥塞程度

TCP 发送方通过检测丢包事件感知网络的拥塞程度,丢包事件包括:

  • 出现定时器超时;
  • 收到来自接收方的三个重复的 ACK;

TCP 将 ACK 确认报文作为数据正常到达接收方的标志,使用 ACK 报文来增加拥塞窗口的长度;与之相对的,一个丢失的报文段意味着网络拥塞,应当降低 TCP 发送方的速率。

接下来将介绍 TCP 拥塞控制算法,包含了三部分:

  1. 慢启动;
  2. 拥塞避免
  3. 快速恢复;

拥塞控制算法

慢启动

慢启动(slow-start)状态,cwnd 从 1 个 MSS 开始,每当传输传输的 TCP 段首次被确认,cwnd 就增加一个 MSS。TCP 发送速率起始慢,但在慢启动阶段以 指数增长

慢启动过程 以及 cwnd 随请求-应答轮次的变化关系如下图所示:

  • 初始时,发送方的拥塞窗口为 1个 MSS;
  • 第一轮交互后,随着第一个 TCP 段顺利收到 ACK 确认标志,cwnd 增加到 2MSS;
  • 第二轮请求应答后,TCP 发送方收到两个 ACK 确认标志,cwnd 从 2 MSS 增加到 4 MSS;
  • 第三轮次交互后,拥塞窗口 cwnd 会变为上一轮此拥塞窗口的两倍。这说明了慢启动是以指数增长的方式,增加拥塞窗口大小。

当出现下列三种情况之一时,慢启动阶段结束:

  1. 当拥塞窗口 cwnd 超过慢启动阈值 ssthresh,就会进入 拥塞避免阶段,ssthresh 一般为 65535 字节。
  2. 存在超时导致的丢包事件:TCP 发送方将慢启动阈值 ssthresh 设置为当前拥塞窗口 cwnd 的一半,随后将拥塞窗口设置为 1MSS,重新开始慢启动过程。
  3. 检测到 3 个冗余的 ACK,TCP 执行快速重传,拥塞控制进入 快速恢复 阶段。

拥塞避免

进入拥塞避免算法后,它的规则是:每当收到一个 ACK 时,cwnd 增加 MSS cwnd ⋅ MSS \frac{\text{MSS}}{\text{cwnd}}\cdot{\text{MSS}} cwndMSS⋅MSS 字节,即每收到 cwnd MSS \frac{\text{cwnd}}{\text{MSS}} MSScwnd 个 ACK 确认段,拥塞窗口增加 1 MSS。

下图是 cwnd 从慢启动阶段进入拥塞避免阶段后的变化曲线:

  • 慢启动阈值 ssthresh 等于 8MSS,第三轮请求后,cwnd 变为 8MSS 大于等于 ssthresh,进入拥塞避免阶段;
  • 第 4 轮请求,发送方可以发送 8个大小为 1MSS 的 TCP 段。如果顺利,发送方会收到 8 个 ACK 确认段,此时 cwnd 会增加 1 MSS cwnd = 8 MSS ⋅ 8 MSS = 1 MSS \frac{1\text{MSS}}{\text{cwnd}=8\text{MSS}}\cdot{8}\text{MSS}=1 \text{MSS} cwnd=8MSS1MSS⋅8MSS=1MSS。因此在第 4 轮请求过后,拥塞窗口增加到 9MSS。
  • 同理,第 5 轮请求,发送方可以发送 9MSS 的 TCP 段,收到 9 个 ACK 后,拥塞窗口增加到 10MSS。

上面的函数图像清晰地展示了,从慢启动阶段进入拥塞避免阶段后,拥塞窗口变成了线性增长

当出现如下情况之一时,拥塞避免阶段结束:

  1. 存在超时导致的丢包事件:TCP 发送方将慢启动阈值 ssthresh 设置为当前拥塞窗口 cwnd 的一半,随后将拥塞窗口设置为 1MSS,从 拥塞避免 转换为 慢启动阶段
  2. 检测到 3 个冗余的 ACK,TCP 执行快速重传,由 拥塞避免阶段 进入 快速恢复阶段

下图为出现超时丢包时,拥塞窗口的变化情况:

拥塞窗口 cwnd 在达到 12MSS 后,出现超时未收到 ACK 确认的情况。状态变量变更情况:

  • 慢启动阈值由原先的 8MSS 更新为当前拥塞窗口大小的一半,即 cwnd = 12 MSS 2 = 6 MSS \frac{\text{cwnd}=12 \text{MSS}}{2}=6\text{MSS} 2cwnd=12MSS=6MSS;
  • 拥塞窗口设置为 1MSS,重新进入慢启动阶段;

快速恢复

快速重传和快速恢复算法一般同时使用,快速恢复算法认为 能收到 3 个重复的 ACK 说明网络并不糟糕,没必要像 RTO 超时时一样直接将 cwnd 锐减至 1MSS。

进入快速恢复阶段前,cwndssthresh 会被更新:

  • cwnd = cwnd/2,即新的拥塞窗口设置为原先的一半大小;
  • ssthresh = cwnd,设置慢启动阈值等于拥塞窗口大小;

进入快速恢复阶段后,执行如下步骤:

  1. 拥塞窗口 cwnd = ssthresh + 3 (3 的意思确认有 3 个数据包被收到);
  2. 重传丢失的数据包;
  3. 如果再收到重复的 ACK,那么 cwnd 增加 1MSS,这一步的目的是 尽快将丢失的数据包发送给接收方
  4. 如果收到新数据的 ACK ,将 cwnd 设置为第一步中的 ssthresh。原因是 ACK 确认了新的数据,说明 重传丢失的数据成功(TCP 累积确认机制保证),恢复过程结束,可以恢复到之前的状态。随后,连接进入 拥塞避免状态

下面为快速恢复阶段,拥塞窗口大小变化示意图:

从图中,我们可以看到几个关键的节点:

  • 第 7 轮结束后,cwnd 为 12MSS。第 8 轮发送的消息中出现了消息丢失,接收方收到大于 [下一个期望序号] 的 TCP 段,于是检测到字节流存在缺口。接收方对 已经接收的最后一个按序字节数据进行反复确认
    当 TCP 发送方收到三个重复的 ACK 后,会将 ssthresh 设置为 cwnd 2 = 12 MSS 2 = 6 MSS \frac{\text{cwnd}}{2}=\frac{12\text{MSS}}{2}=6\text{MSS} 2cwnd=212MSS=6MSS,cwnd 设置为 ssthresh + 3 MSS = 9 MSS \text{ssthresh} + 3\text{MSS}=9\text{MSS} ssthresh+3MSS=9MSS。这就是为什么第 8 轮后,cwnd 变为 9MSS 的原因。
  • 随后,TCP 发送方又接收到了两个重复的 ACK 段,cwnd 从 9MSS 增加为 11 MSS;
  • 在第 11 轮后,TCP 发送方接收到了新的 ACK 段,将 cwnd 设置为 ssthresh=6MSS,进入 拥塞避免阶段

TCP拥塞控制状态机

最后,贴上一张我在学习《计算机网络自顶向下》时,看到的 TCP 拥塞控制状态机,供朋友们参考:

感谢大家的阅读,如果您对本博客有任何建议和疑问,欢迎在评论区里提出,我们一起讨论共同进步!

相关推荐
李姆斯3 分钟前
复盘上瘾症:到底什么时候该“复盘”,什么时候不需要“复盘”
前端·后端·团队管理
嫩萝卜头儿4 分钟前
虚拟地址空间:从概念到内存管理的底层逻辑
linux·服务器·网络
whysqwhw11 分钟前
Kuikly 原生 API 扩展机制对比总结
前端
javachen__15 分钟前
Spring Boot配置error日志发送至企业微信
spring boot·后端·企业微信
seabirdssss23 分钟前
使用Spring Boot DevTools快速重启功能
java·spring boot·后端
亮子AI26 分钟前
【Tailwind, Daisyui】响应式表格 responsive table
前端
喂完待续32 分钟前
【序列晋升】29 Spring Cloud Task 微服务架构下的轻量级任务调度框架
java·spring·spring cloud·云原生·架构·big data·序列晋升
benben04434 分钟前
ReAct模式解读
java·ai
LJC_Superman1 小时前
Web与Nginx网站服务
运维·服务器·前端·网络·数据库·nginx·vim
轮到我狗叫了1 小时前
牛客.小红的子串牛客.kotori和抽卡牛客.循环汉诺塔牛客.ruby和薯条
java·开发语言·算法