【计算机网络】传输层协议（UDP && TCP）

[1. 端口号](#1. 端口号)

端口号的划分

[2. UDP](#2. UDP)

UDP协议格式

[3. TCP](#3. TCP)

1. 端口号

再来聊一聊端口号：

接收的报文到了传输层(tcp/udp)，要向上交付到应用层，应用层的程序有很多，比如(自己写的服务，http、https...)数据要传个哪个程序？这时就需要port来进行标识；

在TCP/IP协议中，用 "源IP"，"源端口号"，"目的IP"，"目的端口号"，"协议号"这样一个五元组来标识-个通信(可以通过netstat -n查看)；IP可以确定哪台机器，Port可以确定哪个应用程序那协议号是干什么的？

如图，IP和Port中间还要经过传输层;经过传输层就需要知道是把报文交给tcp还是udp；

使用命令：netstat -nltp查看

n选项:属性中能用数字显示的就用数字显示
t选项:只查看tcp协议
u选项:只查看udp协议(选项中可以同时带t、u选项)
p选项:查看服务名称(PID那一列)
L选项:只查看listen状态的服务
a选项:查看所有状态的服务(a、l选项可以同时带，效果和a选项效果相同)

端口号的划分

0 -1023:知名端口号，HTTP，FTP，SSH等这些广为使用的应用层协议，他们的端口号都是固定的
1024 - 65535:操作系统动态分配的端口号，客户端程序的端口号，就是由操作系统从这个范围分配的。

普通用户无法绑定0~1023端口;使用root可以绑定；有些服务器是非常常用的，为了使用方便，人们约定一些常用的服务器，都是用以下这些固定的端口号:

ssh服务器，使用22端口
ftp服务器，使用21端口
telnet服务器，使用23端口
http服务器，使用80端口
https服务器，使用443

我们自己写一个程序使用端口号时，要避开这些知名端口号；使用 pidof 查找正在运行的进程的进程ID；

语法：

bash 复制代码

pidof [选项] <进程名>

示例：

bash 复制代码

pidof bash

#多进程：返回所有名为 sshd 和 httpd 的进程的 PID
pidof sshd httpd

2. UDP

UDP（用户数据报协议，User Datagram Protocol）是一种用于网络通信的传输层协议，UDP 是一种无连接的协议，它提供了一种简单、高效的数据传输方式，适合于需要快速交互但不一定需要可靠性的数据传输场景；

UDP 的特点：

无连接性：UDP 不建立连接，数据包是独立的，发送方不需要与接收方建立连接。
低延迟：由于没有连接建立和维护的过程，UDP 通常能提供较低的延迟，非常适合实时应用（如视频会议、在线游戏等）。
不保证可靠性：UDP 不确保数据包的到达，发送的数据可能会丢失或顺序错乱，因此不适合对数据完整性要求高的应用。
简单的报文结构：UDP 的报文结构相对简单，头部较小（只有 8 字节），效率较高。头部包括源端口、目的端口、长度和校验和信息。
多播和广播支持：UDP 支持一对多的通信方式，例如进行多播或广播数据传输。
**面向数据报：**应用层交给UDP多长的报文，UDP原样发送，既不会拆分，也不会合并；比如：用UDP传输100个字节的数据，如果发送端调用一次sendto，发送100个字节，那么接收端也必须调用对应的一次recvfrom，接收100个字节，而不能循环调用10次recvfrom，每次接收10个字节；

UDP协议格式

校验和：通过校验和来验证收到的数据是否在传输中被损坏；

端口号为什么是16位？底层协议udp端口号是16位；

无论是tcp还是udp都要考虑两个问题：

有效载荷和报头分离的问题
有效载荷向上交付的问题

对于udp来说，如何解决有效载荷与报头分离的问题？采用固定报头长度

向上交付的问题呢？目的端口号

在系统中的描述

如何理解报头? 其实就是一个结构化字段

cpp 复制代码

struct udphdr
{
    // 位段
    uint32_t src_port:16;
    uint32_t dst_port:16;
    uint32_t len:16;
    uint32_t checksum:16;
}

怎么判断，收到的报文是完整的?

如果报文长度不到8字节，那么报文一定不完整(报头都不完整)
如果大于8字节，那么就可以从报头中拿到udp的报文长度，长度-8就是数据长度;

比如应用层发消息给另一台主机（消息为hello）

cpp 复制代码

struct udphdr hdr={ 1234，8888，5，XXXX };

需要对消息封装报头：

udp在封装时包含：1.描述结构体 2.保存数据和报头的缓冲区；

这是一个报文的情况，那多个报文呢？

就需要进行管理，在struct sk_buff中还有一个指针(struct sk_buff*)

对报文的管理就变成了对链表的增删查改；

缓冲区

UDP没有真正意义上的发送缓冲区，调用sendto会直接交给内核，由内核将数据传给网络层协议进行后续的传输动作;
UDP具有接收缓冲区。但是这个接收缓冲区不能保证收到的UDP报的顺序和发送UDP报的顺序一致;

如果缓中区满了，再到达的UDP数据就会被丢弃;

UDP的socket既能读，也能写，这个概念叫做全双工；

如何理解"缓冲区"？udp的缓冲区其实就是一个队列，也就是上述管理udp数据的链表；

使用注意事项

我们注意到，UDP协议首部中有一个16位的最大长度，也就是说一个UDP能传输的数据最大长度是64K(包含UDP首部)然而64K在当今的互联网环境下，是一个非常小的数字，如果我们需要传输的数据超过64K，就需要在应用层手动的分包，多次发送，并在接收端手动拼装；

3. TCP

TCP（传输控制协议）广泛用于互联网和其他网络中；主要有以下特点：传输层协议、有连接、可靠传输、面向字节流；

有连接怎么理解？

在使用TCP时需要创建一个listen套接字，然后accept接受客户端连接，然后返回一个普通的套接字；TCP是可靠传输，为例保证消息的送达，需要和每个客户端建立一个连接，通过连接进行一对一的通信；

怎么理解listen套接字？

举个例子：

你和朋友出去玩，到了饭点想找饭店去吃饭，此时看到一家店，外边站着一个人拉着你们进到店里面吃饭，将你们带到店里后，又出去拉其他的客人，进到店里你和朋友又会有其他服务员进行服务（比如：找包间、点菜，上菜）；

拉客的人 --- Listen 套接字：

Listen 套接字负责监听外部连接请求，类似于拉客的人，他们在外面主动接待顾客，等待新客人的到来。当有新顾客出现时，拉客的人将其引导入店，类似于 Listen 套接字准备接受来自客户端的连接。

顾客 --- 连接请求（客户端）：

顾客是连接请求的发起者，他们希望进入饭店就餐。在 TCP 中，客户端通过发送连接请求（SYN）来与你的服务器建立连接。

饭店内部的服务员 --- 普通套接字：

进入餐厅后，顾客会与服务员进行互动，进行下单和就餐。普通套接字用于与已经建立连接的客户端进行双向通信。一旦把顾客引入店里，拉客的人就不再参与沟通，服务员负责提供后续的餐饮服务（即数据交换）

点菜、上菜的过程 --- 数据传输：

在就餐过程中，顾客与服务员之间进行信息交互，类似于数据包的收发。在 TCP 中，这个过程涉及到数据的传输、确认及重传等操作。

餐厅的管理 --- 连接的管理和关闭：

当顾客用餐完毕后，服务员会处理结账并告知顾客如何离开，类似于通过"四次挥手"的过程安全地关闭连接。当一方完成通信时，会发送 FIN 信号，另一方确认接收到这个信号后，结束连接。

缓冲区

tcp具有发送和接受缓冲区，也是全双工通信；

比如：应用层发送一个 "hello" 发送给其他主机，调用 send/write 本质就是将数据写入到发送缓冲区，发送数据时就会从发送缓冲区中拿取数据进行发送；目标主机接收到后会将接收到的数据存放到接收缓冲区；上层调用 read/recv 读取缓冲区中的数据进行处理；

在接受数据时，如果接受缓冲区满了，缓冲区就不再接受数据，再来数据就会直接丢弃

这种设计并不会影响tcp的通信，被丢弃的数据也会通过一定方法，让发送方知道；如果此时还一直保持发送，显然这样是合理的，浪费流量；对于这些问题，需要通过协议来解决；

TCP协议格式

TCP可以做到可靠传输，那它如何确保数据可靠的送到呢？------协议；下面是它的协议格式：

4位首部长度： 0000 取值范围 [0~15]，15字节连tcp报头的标准长度都不够; 这里需要乘首部的基本单位(4字节)那么tcp首部长度范围是[0~60]；tcp首部最长是60字节；

而标准报头的长度是20字节（一行32位，4字节，5行20字节），减去标准报头20字节，选项最多可以是40字节(选项可以忽略)；

如何封装报头呢？

tcp封装报头的过程和udp相似，有一个struct tcphdr结构体struct sk_buffer中维护两个指针，data和tail，封装报头，只需知道报头的大小，然后让data指针向前移到sizeof(tcphdr)字节，将报头数据填充，封装报头;

校验和：通过校验和来验证收到的数据是否在传输中被损坏；

32位序号： 在实际场景中，服务端可能同时接收到许多条消息的，由于收到网络的影响，消息很可能不是按序的到达（收到的数据顺序可能是乱的），这样就会导致数据损坏不能使用；因此它需要保证数据按序到底；如何保证？------**32位序列号；接受方根据报头中的32位序号对数据进行排序，**这样就可以确保接收到的报文是按照顺序的；

32位确认序号： 历史自己发送的哪些报文已经被对方收到，确认序号有这样的规定；**只要收到一个确认序号，就表示接收方已经成功接收了该序号之前的所有字节数据；**比如发送4次，序号分别是100、200、300、400；确认序号通常是201、301、401、501；在应答时前三个报文都可能丢失，但只要收到401就表示401之前的报文都已被接收；

为什么要分32位序号和确认序号，都使用序号不行吗?

因为tcp通信是全双工的，client在向server端发送数据的同时，server端也可能向client端发送数据；

在实际常见中，应答其实是可以和发送的数据合二为一的(1、2步合二为一) ；每次发送消息（包括确认应答）都是一个完整的TCP报文，都包含以下结构：

那么就可以做到，在发送消息的同时，进行消息的确认应答；tcp保证可靠性的同时，还会进行各种提高效率的设定，但这些都是内核自主完成的，用户毫不知情；

标记位

在进行通信时，server 端一定会同时收到各种各样不同类型的报文，这些报文都有类型（建立连接、断开连接、发送数据...）因此就需要有标记位标记消息类型；

SYN建立连接请求，ACK应答，FIN断开连接；

**URG表示紧急数据：**比如服务端收到很多消息，这些消息的处理都需要进行排队，如果来了紧急任务，那么就需要优先对紧急任务进行处理（插队）只要UGR标志位被置为1，就表明是紧急数据；

有标记位，那紧急数据在哪?

这时就需要用到紧急指针，紧急指针是紧急数据在有效载荷中的偏移量，只要URG标记位无效，紧急指针就无效；标记位被置1，就读取紧急指针；找到了紧急数据，那紧急数据的大小是多少？------使用时一般设定为1字节，也就是说允许插队，但不允许大量插队；

比如：

1表示终止或暂停上传行为，2表示...；

服务器压力打，可以设置紧急数据，

recv中的flag字段可以设置接收紧急数据；询问服务状态：0表示状态良好、1表示压力有点大，但还正常、2表示压力有点大，快要撑不住了...；

PSH：表示推送，催促尽快将数据向上交付； 当接收方上层应用层处理比较耗时------卡住了

接受缓冲区就会满，那么接收方在响应时，窗口大小就会置为0，发送方此时就能知道接受方暂时无法继续接受数据，就会停止发送新的数据，问题是，发送方如何知道接受方什么时候能接收数据？发送方会定期发送询问请求(请求只有报头，没有任何数据，报头数据采用上次报头的数据)接收方收到请求就要响应应答，应答时就会附带自己窗口大小；经过多次的询问，如果窗口大小依然是0，这时就可以添加PSH，以前不带PSH，就像一直在问好了没，带上PSH只后就是，好了没赶快把数据向上层交付(表示表单的语义)，PSH不仅仅在这种情况下使用，需要数据尽快交付的场景下都可以使用比如： xshell，连接远端机器，发送指令给ssh，每次发送都会携带PSH，就是为了让指令被快速响应；

**RST：**TCP建立连接需要进行3次握手，但是3次握手也可能会失败，此时就可能会导致，建立连接认知不一致；比如：client向server发送数据，在server处理请求的时候，client端把网线拔了，client端建立的连接就直接释放了；但server并不知道，继续给client发消息；会儿client端恢复网络，client就会疑惑，不是三次握手吗？我还没发请求怎么就应答了，这时client也可以向server发送RST（重置请求）；RST对于双方都是对等的；

面向字节流

用户发送数据，其实只是把数据拷贝到发送缓冲区，对于TCP的缓冲区，可以把发送缓冲区理解成一个char类型的数组（面向字节流以字节为基础单位，和字符数组很像）；比如：发送4个字节，发送的最后字节的序号就是3，（也就是32位序号）对方收到后返回的一般都是4（表示下一次从4开始发，并不代表下一次的序号就是4)比如：第二次继续发4个字节，发送的最后一个字节位置是7，那发送tcp报头中的序号就是7；

接收端收到后，在上层读取时，读取的就是一个一个的字节，这也就是面向字节流；

字节感受到了，流在哪?

注意TCP发送的报文中并没有明确有效载荷的长度；TCP根本就不管报文的分隔；它只管把报头和有效载荷的分离，然后把有效载荷直接无脑的放到接收缓冲区中；所以在接收缓冲区中，可能已经积攒了几十个历史报文的数据；上层读取时，就需要对这些报文进行分割处理(http/https)，在这个过程中缓冲区有拿出数据的，有加入数据的；有出有进就形成了流动的概念；

确认应答机制

TCP为了保证可靠传输，对于每条消息都有一个确认应答机制；

任意一方向另一方发送消息时，接收方都要应答(表示收到)应答机制可以保证，发送的数据被对方已经收到；当然，确认应答的功能不止于此，这里仅需了解有确认应答机制，在下文会进行补充；

流量控制

如果接收方来不及接受数据，发送方会根据接收方的接收能力调整发送速度，暂时停止发送数据或者减少发送数据量，以避免数据丢失或网络拥塞；可以避免流量的浪费；

这个控制的过程由发送方的tcp协议做的（OS）上层用户不需要关心；

如何进行流量控制？发送方要知道接收方的接受能力;

在TCP报头中有一个16位的窗口大小， 用来进行流量控制的字段，表示自己接收缓冲区剩余空间的大小；流量控制的过程由发送方和接受方OS共同协商完成；

超时重传

发送方发送出去消息，如果没有收到应答，就会再次发送数据，超出重传机制可以确保消息被对方接收到；重传机制对于双方来说是对等的；不管是数据还是应答，只要丢了，发送方都会超时重传，这种情况会造成主机B收到两个报文（一般主机B会使用最新的）因此主机B需要有去重操作（根据序号去重）；发送方一旦把数据发送出去一段时间内，已经发送的数据不能被移除;应该被暂时保存起来；

网络状态是变化的；如果超时重传等待时间太久------效率就会变低；如果超时重传等待时间太短------过于频繁的进行重传浪费流量；因此TCP为了保证无论在任何环境下都能比较高性能的通信，因此会动态计算这个最大超时时间；Linux中(BSD Unix和Windows也是如此)，超时以500ms为一个单位进行控制，每次判定超时重发的超时时间都是500ms的整数倍；如果重发一次之后，仍然得不到应答，等待 2*500ms 后再进行重传；如果仍然得不到应答，等待 4*500ms 进行重传。依次类推，以指数形式递增累计到一定的重传次数，TCP认为网络或者对端主机出现异常，强制关闭连接；

连接管理

在正常情况下, TCP要经过三次握手建立连接, 四次挥手断开连接；

server端一定允许同时存在很多个已经完成三次握手的连接；OS需要对多个连接进行管理；描述对象，再组织管理；

cpp 复制代码

struct links {  
    int start_seq;          // TCP连接的起始序列号  
    std::string src_ip;     // 源IP地址  
    std::string dst_ip;     // 目标IP地址  
    int srcport;            // 源端口号  
    int dstport;            // 目标端口号  
    uint64_t timestamp;     // 连接的时间戳，通常用于记录连接建立的时间  
    int status;             // 连接状态，可以用来表示连接的不同状态（如连接中、已连接、关闭等）  
    int urg_data_ptr;       // 指向紧急数据的指针，表示紧急数据的序列号  
    struct links *next;     // 指向下一个连接的指针，用于构建链表结构  
};

双方如果建立连接，那么在双方的0s中就要构建类似于这样的连接结构体，client和server建立连接后，client要维护链接，server也要维护链接；接收方收到紧急数据，把数据加到缓冲，struct links中：urg_data_ptr = 缓冲区中原始报文的地址 + 偏移量，上层读取缓冲区数据没有读到紧急指针，假如只读了10字节:urg_data_ptr = urg_data_ptr - 10；类似这样更新一下紧急指针，双方维护连接是有成本的：时间 + 空间；

链接时会有状态的变化，比如：把一个请求发送过去后，就可以设置状态