【计算机网络】第2篇：端到端通信的形式化刻画——时延、带宽、丢包与吞吐量的数学模型

[1. 引言：为什么要形式化](#1. 引言：为什么要形式化)

[2. 时延的解剖：节点处理模型](#2. 时延的解剖：节点处理模型)

[2.1 时延的四分量分解](#2.1 时延的四分量分解)

[2.2 单跳与多跳的时延累计](#2.2 单跳与多跳的时延累计)

[3. 带宽、吞吐量与丢包](#3. 带宽、吞吐量与丢包)

[3.1 带宽与吞吐量的区别](#3.1 带宽与吞吐量的区别)

[3.2 丢包率及其对吞吐量的影响](#3.2 丢包率及其对吞吐量的影响)

[4. Little定律：并发度与本征吞吐关系](#4. Little定律：并发度与本征吞吐关系)

[4.1 定律的表述与直观理解](#4.1 定律的表述与直观理解)

[4.2 带宽时延积与窗口设计](#4.2 带宽时延积与窗口设计)

[4.3 并发连接数的经验估算](#4.3 并发连接数的经验估算)

[5. 时延与吞吐量的关系：并非简单的反比](#5. 时延与吞吐量的关系：并非简单的反比)

[6. 结语](#6. 结语)

参考文献

1. 引言：为什么要形式化

"网络有点卡"------这是工程师最常听到的反馈，也是最模糊的表述。卡顿可能是DNS解析慢、TCP握手丢包、带宽瓶颈、服务端处理延迟，或是Wi-Fi干扰导致的重传暴增。没有定量分析工具，排查只能靠经验猜测。

形式化建模的价值在于：将模糊的"卡顿"翻译为可测量的参数，将直觉判断转化为公式推导，在动手抓包之前就能缩小故障范围。本文所做的工作，就是为这些参数建立清晰的数学定义和约束关系。

2. 时延的解剖：节点处理模型

2.1 时延的四分量分解

一个数据包从源端发出到目的端接收，经历的时延总额可分解为四个部分。设总时延为 dtotaldtotal，则：

dtotal=dproc+dqueue+dtrans+dpropdtotal=dproc+dqueue+dtrans+dprop

处理时延 dprocdproc 是路由器或主机检查包头、查表转发、差错校验所消耗的时间。现代高速路由器中，这部分通常在微秒量级甚至更低，多数情况下可视为常数。

排队时延 dqueuedqueue 是数据包在输出队列中等待发送的时间。这是四个分量中唯一具有随机性的部分，也是时延抖动的主要来源。排队时延取决于流量到达模式、队列调度算法和缓冲区大小。

传输时延 dtransdtrans 是将数据包的所有比特推送到链路上所需的时间。设数据包长度为 LL 比特，链路带宽为 RR bps，则有：

dtrans=LRdtrans=RL

这是唯一可以通过缩小数据包或增大带宽来直接减少的分量。

传播时延 dpropdprop 是信号在物理介质中传播所需的时间，等于链路物理距离 DD 除以信号传播速度 vv：

dprop=Dvdprop=vD

在铜缆和光纤中，vv 约为 2×1082×108 m/s。北京到纽约的光缆距离约15000公里，单向传播时延约75毫秒。这个值由物理定律决定，无法通过工程手段改善。

2.2 单跳与多跳的时延累计

单链路的四个分量似乎已经概括了时延问题。但端到端通信通常穿越多条链路，设路径包含 NN 条链路、N−1N−1 个路由器，则端到端时延为：

de2e=∑i=1N(dproc(i)+dqueue(i)+dtrans(i)+dprop(i))de2e=i=1∑N(dproc(i)+dqueue(i)+dtrans(i)+dprop(i))

一个容易忽视的点是：各跳的传输时延可能不同。 如果路径中某段是低带宽链路（比如最后一公里的ADSL），它将成为传输时延的主导项。假设一个1500字节的包通过100 Mbps光纤链路只需0.12毫秒，但通过5 Mbps瓶颈链路则需要2.4毫秒------差了20倍。这正是"带宽不对称路径"在时延分析中的重要性。

3. 带宽、吞吐量与丢包

3.1 带宽与吞吐量的区别

这两个概念常被混用，但有明确区别。带宽是链路理论上支持的最大数据传输速率，单位bps，是链路的静态属性。吞吐量是实际测量到的有效数据传输速率，是受协议开销、拥塞控制和丢包重传等因素影响后的动态表现。

设应用层实际接收的比特数为 DD，传输耗时为 TT，则吞吐量为 DTTD。如果TCP的发送速率触及链路带宽上限，吞吐量接近带宽；如果存在拥塞，吞吐量可能远低于带宽。

协议开销造成的损耗不可忽视。一个1500字节的TCP数据段，实际承载的应用数据取决于协议栈各层的头部开销：20字节TCP头、20字节IP头、以太网帧的18字节帧头帧尾、加上12字节帧间隙。理论最大吞吐量为：

Throughputmax⁡=MSSMSS+Overhead×RThroughputmax=MSS+OverheadMSS×R

以以太网为例，MSS为1460字节时，开销约70字节，净效率约95.4%。

3.2 丢包率及其对吞吐量的影响

丢包率 pp 定义为丢失的数据包占总发送包的比例。丢包的原因分为两类：拥塞丢包 （缓冲区溢出）和传输差错丢包（物理信号错误）。有线网络中传输差错丢包通常极低（<10−6<10−6），丢包绝大部分是拥塞造成的。

丢包对TCP吞吐量的影响是非线性的。经典的TCP Reno吞吐量模型给出了估算公式：

Throughput≈MSSRTT×p×CThroughput≈RTT×pMSS×C

其中 CC 为常数（约1.22）。关键结论是：**吞吐量不是与丢包率成反比，而是与其平方根成反比。**丢包率上升4倍，吞吐量约下降一半。这解释了为什么极小的丢包率也会显著拉低TCP性能------在高带宽长时延网络中尤其明显。

4. Little定律：并发度与本征吞吐关系

4.1 定律的表述与直观理解

Little定律由John Little于1961年提出，是排队论中最优美且普适的结论。其表述极简：

L=λ×WL=λ×W

其中 LL 是系统内的平均顾客数（并发度），λλ 是平均到达率，WW 是每个顾客在系统内的平均驻留时间。

将网络连接映射到这个模型：LL 对应正在网络中传输的未确认数据量（飞行中的字节数），λλ 对应有效吞吐量（字节/秒），WW 对应端到端RTT。于是得到网络版本的Little定律：

Data-in-Flight=Throughput×RTTData-in-Flight=Throughput×RTT

4.2 带宽时延积与窗口设计

上式中令Throughput取最大值（即瓶颈带宽 BB），得到：

BDP=B×RTTmin⁡BDP=B×RTTmin

这就是带宽时延积，表示在无拥塞条件下，网络管道中可容纳的最大未确认数据量。

BDP直接决定了TCP接收窗口和发送缓冲区的最小设计值。典型场景：100 Mbps链路，RTT为30 ms，BDP约为375 KB。这意味着TCP通告窗口至少需要达到375 KB才能充分利用这条链路。如果窗口小于BDP，发送方总是在等待确认中浪费时间，带宽大量空闲。传统TCP窗口字段仅16位（最大64 KB），在高带宽长时延网络上直接成为瓶颈，这正是窗口缩放选项提出的动机。

4.3 并发连接数的经验估算

Little定律也能反过来用于容量估算。若已知目标吞吐量为 TT，平均请求处理延迟为 dd，则需要维持的并发连接数至少为 T×dT×d。

假设某服务在高峰期需要支持每秒10000个请求，后端每个请求的平均处理时间为50 ms。根据Little定律，系统内平均同时驻留的请求数为 10000×0.05=50010000×0.05=500。这500就是数据库连接池、线程池和工作队列的下限设计值。低于此值则吞吐量无法达到预期，远高于此值则增加调度开销而不带来增益。

5. 时延与吞吐量的关系：并非简单的反比

一个常见误解是以为增大带宽必然降低时延。从时延分解公式可以看出，带宽 RR 仅影响传输时延 L/RL/R。对于小数据包或长距离链路，传播时延 dpropdprop 占主导，再大的带宽也对时延无济于事。

考虑一个极端案例：发送1字节数据从北京到纽约。传输时延在100 Mbps链路为 8×10−88×10−8 秒，在1 Gbps链路为 8×10−98×10−9 秒，差异可以忽略。但传播时延永远是约75毫秒，无法缩短。这就是为什么CDN和边缘计算要将数据推近用户------它们优化的是传播时延，而不是传输时延。

6. 结语

本文建立的数学框架足够简单，却极具实用性。工程师在遇到性能问题时，应当首先确定被限制的是哪个参数------是带宽瓶颈还是时延瓶颈，是丢包过高还是窗口过小。时延四分量分解锁定物理限制的位置，带宽时延积给出缓冲区配置的下限，Little定律将时延、吞吐量与并发度统一为简洁的数量关系，而丢包率与吞吐量的平方根关系则提醒我们：哪怕是极小的丢包，在高带宽长时延网络中也可能是性能杀手。

这些公式并非放在论文里供引用的装饰品，而是日常排障中能够直接提供数量级判断的工具。

参考文献

$1$ Kurose, J. F., & Ross, K. W. Computer Networking: A Top-Down Approach (8th ed.). Pearson, 2020.

$2$ Little, J. D. C. A proof for the queuing formula: L=λWL=λW. Operations Research, 9(3): 383-387, 1961.

$3$ Mathis, M., Semke, J., Mahdavi, J., & Ott, T. The macroscopic behavior of the TCP congestion avoidance algorithm. ACM SIGCOMM CCR, 27(3): 67-82, 1997.

$4$ Padhye, J., Firoiu, V., Towsley, D., & Kurose, J. Modeling TCP Reno performance. IEEE/ACM Trans. Networking, 8(2): 133-145, 2000.