UDP 的报文结构和注意事项

1. UDP的特点

1.无连接

就像发短信给对方，只需要对方的端口和IP地址。不需要连接。

2.不可靠传输

没有任何安全机制，发送端发送数据报以后，如果因为⽹络故障该段⽆法发到对⽅，UDP协议层也不会给应⽤层返回任何错误信息。

3.面向数据报
应⽤层交给UDP多⻓的报⽂（载荷），UDP原样发送，既不会拆分，也不会合并

4.缓冲区
UDP只有接收缓冲区，没有发送缓冲区：
4.1 UDP没有真正意义上的发送缓冲区。发送的数据会直接交给内核，由内核将数据传给⽹络层
协议进⾏后续的传输动作；
4.2 UDP具有接收缓冲区，但是这个接收缓冲区不能保证收到的UDP报的顺序和发送UDP报的顺
序⼀致；如果缓冲区满了，再到达的UDP数据就会被丢弃；
4.3 UDP的socket既能读，也能写，这个概念叫做全双工

5.大小受限

UDP协议⾸部中有⼀个16位的最⼤⻓度。也就是说⼀个UDP能传输的数据最⼤⻓度是64K（包含UDP⾸部）

2. UDP报文结构

下图就是UDP的大概结构：

2.1源端口和目的端口

可以通过下图来简单理解：

2.2 UDP长度

16位报文长度描述的是UDP数据报中数据的大小。其大小是2个字节，其表示的范围就是0-65535，换算出来就是64KB的大小。因此，一个UDP数据报一次最大只能传输64KB大小的数据。

但如果应用层数据报超过了64KB怎么办?那么我们就可以:

1.在应用层，通过代码的方式针对应用层数据报进行手动的分成若干部分，拆分成多个UDP数据报进行传输（send多次）。

2.把UDP的全部改为TCP进行传输。

2.3 UDP检验和

2.3.1 CRC算法

UDP中校验和，使用的是一种比较简单的方式，CRC算法来完成校验。

伪代码：

java 复制代码

        short checksum = 0;
        for(遍历取出数据报中的每个字节数据){
            checksum += 当前字节的数据; 
        }

**注意点：**在这里checksum 相加的过程中，产生的数据可能比较大，超出short的俩个字节的范围，就溢出了，在这里的话也不管溢出。

**工作原理：**UDP数据报发送方，在发送之前，先计算一遍CRC，把算好的CRC值放到UDP数据报中（设这个CRC值为value1），接下来这个数据包通过网络传输到达接收端，接收端收到这个数据之后，也会按照同样的算法，再算一遍CRC的值，得到的结果是value2。比较自己计算的value2和收到的value1 是否一致，如果是一致的，就说明数据是ok的。如果不一致传输过程中发生了比特翻转了。

**注意点：**上述CRC算法中，如果只有一个bit位发生翻转，此时就能发现问题，如果有多个bit位发生翻转，有可能恰好校验和之前一样（虽然概率很低，但是也不希望这样子的事情发生）。

2.3.2 除了CRC之外高精度的校验和算法

其实除了CRC，在业界还有一个很常用的，md5/sha1 算法。

md5的特点：

定长：无论原始数据多长，算出来的md5的最终值都是固定长度，常见的md5有16位版本（2字节），32为版本（4字节），64为版本（8字节）。
分散：计算md5的过程中，原始数据只要变化了一点点，算出来的md5值就会差异很大。
不可逆：给一个源字符串，计算md5值，这个过程非常简单，但是给你一个算好的md5值，让你把他还原回原始字符串，理论上无法完成的。（就像猪肉变成火腿一样）。