目录
前言
本篇文章会围绕UDP报文的结构,对此协议展开详细的讲解,比如报文中每个字段的作用、以及填写方式。
阅读完这篇文章,你会对UDP数据报结构有个透彻的认识,进而体会UDP协议持有相关特性的原因。
报文结构
UDP协议是面向数据报进行传输的 。例如发送端发送一个100字节的数据报,那么接收端只能一次性把这个100字节的数据报接收。 而不能分段接收!比如100个字节,分成10次接收,每次接收10个字节,这样是不允许的,因为UDP协议中数据传输最小的单位就是一个数据报,而不是字节。
如图,一个UDP数据报的结构:
UDP正文部分功能很简单,用于存储需要传输的数据,不用过多介绍,这里主要讲解UDP报头部分的四个字段的功能。
1、源端口号&目的端口号
分别存储客户端和服务器端应用程序的端口号。2个字节,8个比特位,刚好覆盖端口号的大小,即0------65535。
注意: UDP是传输层协议,不太关心IP地址,因此不会把IP地址封装到UDP数据报中,需要把数据报传递个网络层,由网络层对IP地址进行封装。
2、UDP长度
UDP长度的单位是字节
,也就是说UDP长度是用来表示这个数据报的内存大小的 。
例如,一个数据报长度是100,那么这个数据报的内存大小就是100个字节(包含8字节数据报报头)。
由于长度字段只分配了2个字节进行存储,因此其数据报长度的表示范围只能在[8,65535]。
一个数据报的内存结构图:
也就是说,UDP协议,一次传输的数据大小最多是64KB。放到当今的互联网时代,64KB算不上多,这也算是UDP协议的一个局限。因为这个协议诞生年代久远,是1980年推出的,当时没有想到现在互联网发展速度如此之快。
3、校验和
概念
校验和(checksum)以需要传输的实际数据(包括IP地址以及报头、载荷)作为参数,进行相关计算得到的一个二进制数字。发送端把校验和计算好,填入对应字段,发送给客户端,接收端拿到数据,会用相同的计算方式重新计算校验和,如果和原来的校验和不匹配,说明当前传输过来的数据出现了错误,需要把它丢弃。
注意,UDP协议把数据报丢弃后,不要求重传,这也是为什么说UDP协议传输不可靠的原因,如果确实需要重传,需要采用其他方式进行,比如应用层重传机制等。
校验和计算方法
详细的计算流程不用掌握,大致了解即可。
UDP校验和的计算方法,一般采用"一的补码"进行计算:
- 准备伪头部:
-
伪头部的生成需要借助网络层,以为它需要获取IP地址以及协议号。因此伪头部并不是UDP数据报的一部分,它只是计算校验和临时生成的数据
。伪头部具体包含以下内容:- 源IP地址(32位)
- 目的IP地址(32位)
- 保留字段(8位,值为0)
- 协议类型(8位,UDP的值为17)
- UDP长度(16位,即整个UDP报文的长度,包括头部和数据部分)
-
伪头部的目的是确保IP地址和协议类型在计算校验和时被考虑到,从而提高校验和的可靠性。
-
准备UDP头部和数据部分:
-
UDP头部和数据部分一同参与校验和的计算。UDP头部由以下字段组成:
- 源端口(16位)
- 目的端口(16位)
- UDP长度(16位)
- 校验和字段(16位,初始化时置为0)
- 数据部分是指UDP报文中实际传输的用户数据。
-
-
将所有字段组合在一起:
- 将伪头部、UDP头部、数据部分按顺序组合在一起形成一个数据流。
- 将连续的数据流按照16位(2个字节)一组分割。
-
以16位为单位进行逐个加法:
- 将数据流中的每两个字节(16位)视为一个单元,逐个相加。如果结果超过了16位(即出现溢出),将溢出的高位加到低位上。
-
取反:
- 将得到的加和值取反(即按位取反),生成最终的16位校验和值。
-
填入校验和字段:
- 将计算得到的校验和值填入UDP头部的校验和字段。
除了上面这个算法,关于校验和的计算,还有很多其他常用的算法,比如CRC、MD5、SHA等。这些算法根据不同的场景或者协议被广泛使用。