【网络】传输层协议UDP

文章目录

[1. 再谈端口号](#1. 再谈端口号)
[2. UDP协议](#2. UDP协议)
- [2.1 UDP协议端格式](#2.1 UDP协议端格式)
- [2.2 UDP特点](#2.2 UDP特点)
- [2.3 UDP 的缓冲区](#2.3 UDP 的缓冲区)
- [2.4 基于 UDP 的应用层协议](#2.4 基于 UDP 的应用层协议)

传输层主要负责：将数据从发送端传输到接收端

1. 再谈端口号

端口号标识了一个主机上进行通信的不同的应用程序，如下图：

为了解决将数据传给哪个应用程序处理的问题，在上图所示的数据中，一定包含了一个协议报头，报头中有端口号，指明将数据转发给哪个具体的服务。

在 TCP/IP 协议中, 用 "源 IP"，"源端口号"，"目的 IP"， "目的端口号"， "协议号" 这样一个五元组来标识一个通信(可以通过 netstat -n 查看)；

端口号范围划分：

0 - 1023: 知名端口号，HTTP、FTP、SSH 等这些广为使用的应用层协议，他们的端口号都是固定的

1024 - 65535: 操作系统动态分配的端口号。客户端程序的端口号，就是由操作系统从这个范围分配的

认识知名端口号：

有些服务器是非常常用的，为了使用方便, 人们约定一些常用的服务器，都是用以下这些固定的端口号：

ssh 服务器, 使用 22 端口

ftp 服务器, 使用 21 端口

telnet 服务器, 使用 23 端口

http 服务器, 使用 80 端口

https 服务器, 使用 443

可使用cat /etc/services 命令查看知名端口号

2. UDP协议

2.1 UDP协议端格式

我们知道，协议其实在操作系统中，就是struct或class

添加协议报头就是把结构体对象和上层传递来的数据拷贝合并起来（封装）。

上图就是UDP协议的格式

那UDP是如何解包的呢？又是如何分用的呢？

解包：因为UDP的报头是固定长度的，得到以后，直接读取前8个字节，剩下的就是有效载荷。

分用：根据16位的目的端口号，去系统中查找进程，看哪个进程绑定了该端口号，然后将报文转给进程。
这也证明了为什么我们之前写的UDP端口号为int16_t类型的，因为操作系统报头协议中规定的是16位。

由于UDP是面向数据报的，那怎么确定报文的完整性呢？

16 位UDP 长度(协议中的自描述字段) ，表示整个数据报(UDP 首部+UDP 数据)的最大长度;
- 先读取报头，根据报头中16位UDP长度，使用UDP长度- 8，剩下的就是有效载荷的长度。
16位UDP检验和：虽然UDP不保证报文的可靠性，但UDP要保证交给上层的数据是合法、正确的；所以如果校验和出错，就会直接丢弃报文；

下图是linux源码中UDP协议的报头：

2.2 UDP特点

UDP 传输的过程类似于寄信

无连接: 知道对端的 IP 和端口号就直接进行传输，不需要建立连接;
不可靠: 没有确认机制，没有重传机制；如果因为网络故障该段无法发到对方，UDP 协议层也不会给应用层返回任何错误信息；
面向数据报: 不能够灵活的控制读写数据的次数和数量;

面向数据报：

应用层交给 UDP 多长的报文， UDP 原样发送，既不会拆分，也不会合并

例如用 UDP 传输 100 个字节的数据:
如果发送端调用一次 sendto，发送100个字节，那么接收端也必须调用对应的一次 recvfrom，接收 100 个字节；而不能循环调用 10 次 recvfrom，每次接收 10 个字节 (即收发次数对应)

2.3 UDP 的缓冲区

UDP 没有真正意义上的发送缓冲区，因为它不保证可靠性；你把数据交给UDP，其处理后调用 sendto 会直接交给内核，由内核将数据传给网络层协议进行后续的传输动作；
UDP 具有接收缓冲区，但是这个接收缓冲区不能保证收到的 UDP 报的顺序和发送 UDP 报的顺序一致；如果缓冲区满了，再到达的 UDP 数据就会被丢弃

UDP 的 socket 既能读，也能写，这个概念叫做全双工

UDP 使用注意事项：

我们注意到， UDP 协议首部中有一个 16 位的最大长度。也就是说一个 UDP 能传输的数据最大长度是2¹⁶即 64KB(包含 UDP 首部)。

然而 64K 在当今的互联网环境下，是一个非常小的数字。如果我们需要传输的数据超过 64K,就需要在应用层手动的分包, 多次发送, 并在接收端手动拼装;

2.4 基于 UDP 的应用层协议

NFS: 网络文件系统
TFTP: 简单文件传输协议
DHCP: 动态主机配置协议
BOOTP: 启动协议(用于无盘设备启动)
DNS: 域名解析协议