文章目录
- [1. 再谈端口号](#1. 再谈端口号)
- [2. UDP协议](#2. UDP协议)
-
- [2.1 UDP协议端格式](#2.1 UDP协议端格式)
- [2.2 UDP特点](#2.2 UDP特点)
- [2.3 UDP 的缓冲区](#2.3 UDP 的缓冲区)
- [2.4 基于 UDP 的应用层协议](#2.4 基于 UDP 的应用层协议)
传输层主要负责:将数据从发送端传输到接收端
1. 再谈端口号
端口号标识了一个主机上进行通信的不同的应用程序,如下图:
为了解决将数据传给哪个应用程序处理的问题
,在上图所示的数据中,一定包含了一个协议报头,报头中有端口号,指明将数据转发给哪个具体的服务。
在 TCP/IP 协议中, 用 "源 IP"
,"源端口号"
,"目的 IP"
, "目的端口号"
, "协议号"
这样一个五元组来标识一个通信(可以通过 netstat -n 查看);
端口号范围划分:
- 0 - 1023: 知名端口号,HTTP、FTP、SSH 等这些广为使用的应用层协议,他们的端口号都是固定的
- 1024 - 65535: 操作系统动态分配的端口号。 客户端程序的端口号,就是由操作系统从这个范围分配的
认识知名端口号:
有些服务器是非常常用的,为了使用方便, 人们约定一些常用的服务器,都是用以下这些固定的端口号:
- ssh 服务器, 使用 22 端口
- ftp 服务器, 使用 21 端口
- telnet 服务器, 使用 23 端口
- http 服务器, 使用 80 端口
- https 服务器, 使用 443
可使用cat /etc/services
命令查看知名端口号
2. UDP协议
2.1 UDP协议端格式
我们知道,协议其实在操作系统中,就是struct或class
添加协议报头就是把结构体对象和上层传递来的数据拷贝合并起来(封装)。
上图就是UDP协议的格式
那UDP是如何解包的呢?又是如何分用的呢?
- 解包:因为UDP的报头是固定长度的,得到以后,直接读取前8个字节,剩下的就是有效载荷。
- 分用:根据16位的目的端口号,去系统中查找进程,看哪个进程绑定了该端口号,然后将报文转给进程。
这也证明了为什么我们之前写的UDP端口号为int16_t
类型的,因为操作系统报头协议中规定的是16位。
由于UDP是面向数据报的,那怎么确定报文的完整性呢?
- 16 位UDP 长度(协议中的自描述字段) ,表示整个数据报(UDP 首部+UDP 数据)的最大长度;
- 先读取报头,根据报头中16位UDP长度,使用UDP长度- 8,剩下的就是有效载荷的长度。
- 16位UDP检验和:虽然UDP不保证报文的可靠性,但UDP要保证交给上层的数据是合法、正确的;所以如果校验和出错,就会直接丢弃报文;
下图是linux源码中UDP协议的报头:
2.2 UDP特点
UDP 传输的过程类似于寄信
- 无连接: 知道对端的 IP 和端口号就直接进行传输,不需要建立连接;
- 不可靠: 没有确认机制,没有重传机制;如果因为网络故障该段无法发到对方,UDP 协议层也不会给应用层返回任何错误信息;
- 面向数据报: 不能够灵活的控制读写数据的次数和数量;
面向数据报:
应用层交给 UDP 多长的报文, UDP 原样发送, 既不会拆分,也不会合并
- 例如用 UDP 传输 100 个字节的数据:
如果发送端调用一次 sendto,发送100个字节,那么接收端也必须调用对应的一次 recvfrom,接收 100 个字节;而不能循环调用 10 次 recvfrom,每次接收 10 个字节 (即收发次数对应)
2.3 UDP 的缓冲区
- UDP 没有真正意义上的发送缓冲区,因为它不保证可靠性;你把数据交给UDP,其处理后调用 sendto 会直接交给内核,由内核将数据传给网络层协议进行后续的传输动作;
- UDP 具有接收缓冲区, 但是这个接收缓冲区不能保证收到的 UDP 报的顺序和发送 UDP 报的顺序一致; 如果缓冲区满了,再到达的 UDP 数据就会被丢弃
UDP 的 socket 既能读,也能写,这个概念叫做全双工
UDP 使用注意事项:
我们注意到, UDP 协议首部中有一个 16 位的最大长度。也就是说一个 UDP 能传输的数据最大长度是2^16^即 64KB(包含 UDP 首部)。
然而 64K 在当今的互联网环境下,是一个非常小的数字。 如果我们需要传输的数据超过 64K,就需要在应用层手动的分包, 多次发送, 并在接收端手动拼装;
2.4 基于 UDP 的应用层协议
- NFS: 网络文件系统
- TFTP: 简单文件传输协议
- DHCP: 动态主机配置协议
- BOOTP: 启动协议(用于无盘设备启动)
- DNS: 域名解析协议