传输层协议UDP

传输层协议UDP

传输层

负责数据能够从发送端传输到接收端。

端口号

端口号(Port)标识了一个主机上进行通信的不同的应用程序;

在TCP/IP 协议中, 用"源IP", "源端口号", "目的IP", "目的端口号", "协议号" 这样一个五元组来标识一个通信(可以通过netstat -n 查看);

其中"源IP", "源端口号", "目的IP", "目的端口号"四元组规定了世界上唯一的两个进程。"协议号"就是我们从网络层向传输层交付的时候,需要我们的协议号来确定用的是TCP还是UDP。

  • 上图客户端A和客户端B可以通过不同的主机ip区分
  • 客户端A两个画面就是通过不同的端口号来区分的
  • 一个进程可以绑定多个端口号
  • 一个端口号只可以被一个进程使用
  • 其中IP首部包括我们的协议号 就是为了当报文从网络层向上次传输层交付时确定传输层协议用的是UDP协议还是TCP协议

知名端口号

  • ftp 服务器, 使用21 端口
  • telnet 服务器, 使用23 端口
  • http 服务器, 使用80 端口
  • https 服务器, 使用443
  • ssh 服务器,使用22端口

查看知名端口号

shell 复制代码
cat /etc/services

我们自己写一个程序使用端口号时, 要避开这些知名端口号。

UDP协议端格式

  • 16位UDP长度,表示整个数据报(UDP首部+UDP数据)的长度
  • 如果校验和出错,就会直接丢弃

内核结构

因为我们的UDP协议结构是固定的因此我们无须做序列化、反序列化。可以直接传输结构体。因为操作系统内核UDP的结构都是C语言写的且代码一样。

UDP特点

  • 无连接:知道对端的IP和端口号就直接进行传输, 不需要建立连接;(TCP我们在写代码时客户端还要进行connect,服务端要进行accept)
  • 不可靠: 没有确认机制, 没有重传机制; 如果因为网络故障该段无法发到对方,UDP 协议层也不会给应用层返回任何错误信息;
  • 面向数据报: 不能够灵活的控制读写数据的次数和数量;也就是发几个UDP报文,对方就要收几次,并且每次发多大,对端就读多大。

面向数据报

应用层交给UDP 多长的报文, UDP 原样发送, 既不会拆分, 也不会合并;

用UDP 传输100 个字节的数据:

  • 如果发送端调用一次sendto, 发送100 个字节, 那么接收端也必须调用对应的一次recvfrom, 接收100 个字节; 而不能循环调用10 次recvfrom, 每次接收10 个字节;

UDP缓冲区

  • UDP 没有真正意义上的发送缓冲区. 调用sendto 会直接交给内核, 由内核将数据传给网络层协议进行后续的传输动作;
  • UDP 具有接收缓冲区. 但是这个接收缓冲区不能保证收到的UDP 报的顺序和
    发送UDP 报的顺序一致; 如果缓冲区满了, 再到达的UDP 数据就会被丢弃;
  • UDP 的socket 既能读, 也能写, 这个概念叫做全双工
  • UDP之所以没有发送缓冲区是因为UDP是不可靠的他不会保证数据重传
  • UDP之所以有接受缓冲区是因为应用层繁忙时,可以继续接受数据。

报文的理解

报文的内核数据结构sk_buff

  • 报文在内核中表示就是sk_buff结构加对应指向的空间大小
  • 因此所谓的封包和解包在内核中就是data指针移动对应协议大小字节。
  • 图中的指针类型都是char *

报文在IP协议栈传输的本质

  • 因此各层之间传输报文只是传输我们的sk_buff结构变量 指向的空间不动
    只不过进行封包、解包时data指针移动即可

应用层进行报文解析会影响OS从网络中读取数据吗

  • 当然会,可以理解为并行的OS进行报文解析是在进行进程调度算法,就是cpu的时钟中断触发的,但是OS还有硬件中断,当网卡有数据时就会触发硬件中断来进行读取数据

UDP 使用注意事项

我们注意到, UDP 协议首部中有一个16 位的最大长度. 也就是说一个UDP 能传输的数据最大长度是64K(包含UDP 首部).

然而64K 在当今的互联网环境下, 是一个非常小的数字.

如果我们需要传输的数据超过64K, 就需要在应用层手动的分包, 多次发送, 并在接收端手动拼装;

基于UDP的应用层协议

  • NFS:网络文件系统
  • TETP:简单文件传输协议
  • DHCP:动态主机配置协议
  • BOOTP:启动协议(用于无盘设备启动)
  • DNS:域名解析协议
  • 当然, 也包括你自己写UDP 程序时自定义的应用层协议;