自学嵌入式第27天------TCP和UDP,URL爬虫

1. TCP和UDP区别

**TCP(传输控制协议)UDP(用户数据报协议)**是两种主要的传输层协议,它们在数据传输方式上有显著区别:

  • 连接性

    • TCP是面向连接的协议,通信前需通过三次握手建立连接,通信结束后通过四次挥手断开连接。

    • UDP是无连接的协议,发送数据前无需建立连接,直接发送数据包。

  • 可靠性

    • TCP提供可靠传输,确保数据按序到达,丢失或损坏的数据包会重传。

    • UDP不保证可靠性,数据包可能丢失、重复或乱序。

  • 数据顺序

    • TCP保证数据按发送顺序到达。

    • UDP不保证顺序,数据包可能乱序到达。

  • 速度

    • TCP因连接建立、确认和重传机制,速度较慢。

    • UDP无这些机制,传输速度更快。

  • 头部开销

    • TCP头部较大(20字节),包含序列号、确认号等字段。

    • UDP头部较小(8字节),仅包含基本信息。

  • 适用场景

    • TCP适用于要求可靠传输的场景,如网页浏览、文件传输。

    • UDP适用于实时性要求高的场景,如视频流、在线游戏。

2. TCP和UDP的Socket编写流程

TCP Socket编写流程

  • 服务器端

    1. 创建Socket:socket(AF_INET, SOCK_STREAM, 0)

    2. 绑定地址:bind(sockfd, (struct sockaddr*)&servaddr, sizeof(servaddr))

    3. 监听连接:listen(sockfd, backlog)

    4. 接受连接:accept(sockfd, (struct sockaddr*)&cliaddr, &clilen)

    5. 读写数据:read()write()

    6. 关闭Socket:close(sockfd)

  • 客户端

    1. 创建Socket:socket(AF_INET, SOCK_STREAM, 0)

    2. 连接服务器:connect(sockfd, (struct sockaddr*)&servaddr, sizeof(servaddr))

    3. 读写数据:read()write()

    4. 关闭Socket:close(sockfd)

UDP Socket编写流程

  • 服务器端

    1. 创建Socket:socket(AF_INET, SOCK_DGRAM, 0)

    2. 绑定地址:bind(sockfd, (struct sockaddr*)&servaddr, sizeof(servaddr))

    3. 接收数据:recvfrom(sockfd, buf, sizeof(buf), 0, (struct sockaddr*)&cliaddr, &clilen)

    4. 发送数据:sendto(sockfd, buf, sizeof(buf), 0, (struct sockaddr*)&cliaddr, clilen)

    5. 关闭Socket:close(sockfd)

  • 客户端

    1. 创建Socket:socket(AF_INET, SOCK_DGRAM, 0)

    2. 发送数据:sendto(sockfd, buf, sizeof(buf), 0, (struct sockaddr*)&servaddr, sizeof(servaddr))

    3. 接收数据:recvfrom(sockfd, buf, sizeof(buf), 0, NULL, NULL)

    4. 关闭Socket:close(sockfd)

3. TCP为什么安全可靠

TCP的安全可靠性源于以下机制:

  • 三次握手:确保连接建立时双方都准备好通信。

  • 数据包确认与重传:接收方确认收到的数据包,发送方未收到确认则重传。

  • 数据包排序:TCP通过序列号保证数据按序到达。

  • 流量控制:通过滑动窗口机制防止接收方缓冲区溢出。

  • 拥塞控制:通过拥塞窗口和慢启动机制避免网络拥塞。

4. TCP机制

TCP的核心机制包括:

  • 三次握手:建立连接时,客户端和服务器交换SYN和ACK包。

  • 四次挥手:断开连接时,双方交换FIN和ACK包。

  • 数据包确认与重传:接收方确认数据包,发送方未收到确认则重传。

  • 滑动窗口:控制发送方发送数据的速率,防止接收方缓冲区溢出。

  • 拥塞控制:通过慢启动、拥塞避免等算法防止网络拥塞。


TCP(传输控制协议)通过多种机制来保证数据传输的可靠性、效率和流量控制。以下是这些机制的详细解释:


1. 应答机制(Acknowledgment Mechanism)

  • 作用:确保数据包被成功接收。

  • 原理

    • 接收方收到数据后,会向发送方发送一个ACK(确认应答),ACK中包含已成功接收的数据包的序列号。

    • 发送方根据ACK确认数据已成功送达,若未收到ACK,则触发重传机制。

  • 特点

    • 确认的是连续数据的最后一个字节的序列号。

    • 例如,发送方发送序列号为1-1000的数据,接收方收到后会发送ACK=1001,表示期望接收下一个序列号为1001的数据。


2. 超时重传机制(Retransmission Timeout Mechanism)

  • 作用:解决数据包丢失或ACK丢失的问题。

  • 原理

    • 发送方发送数据后启动一个定时器,若在超时时间内未收到ACK,则认为数据包丢失,触发重传。

    • 超时时间(RTO, Retransmission Timeout)是动态计算的,基于网络往返时间(RTT)。

  • 特点

    • 超时重传是TCP可靠性的核心机制之一。

    • 如果多次重传失败,TCP会断开连接。


3. 流量控制机制(Flow Control Mechanism)

  • 作用:防止发送方发送数据过快,导致接收方缓冲区溢出。

  • 原理

    • 接收方通过窗口大小字段(Window Size)告知发送方其缓冲区剩余空间。

    • 发送方根据窗口大小调整发送数据的速率。

  • 特点

    • 窗口大小为0时,发送方会暂停发送,直到接收方通知有可用缓冲区空间。

    • 通过滑动窗口实现动态调整。


4. 滑动窗口机制(Sliding Window Mechanism)

  • 作用:提高数据传输效率,允许发送方在未收到ACK的情况下连续发送多个数据包。

  • 原理

    • 发送方和接收方各自维护一个窗口,窗口大小由接收方的缓冲区空间决定。

    • 发送方窗口内的数据可以连续发送,无需等待ACK。

    • 接收方确认数据后,窗口向前滑动,发送方可以发送新的数据。

  • 特点

    • 滑动窗口大小是动态调整的,受流量控制和拥塞控制影响。

    • 支持累计确认,即ACK确认的是连续数据的最后一个字节。


5. 延时应答机制(Delayed Acknowledgment Mechanism)

  • 作用:减少ACK的数量,提高网络利用率。

  • 原理

    • 接收方收到数据后,不立即发送ACK,而是等待一段时间(通常为200ms)。

    • 如果在等待期间有数据需要发送给发送方,则可以将ACK捎带在数据包中发送。

  • 特点

    • 减少了单独的ACK包,降低了网络开销。

    • 适用于双向通信场景。


6. 捎带应答机制(Piggybacking Acknowledgment Mechanism)

  • 作用:将ACK信息附加在数据包中发送,减少单独发送ACK的开销。

  • 原理

    • 当接收方需要发送数据给发送方时,可以将ACK信息附加在数据包中一起发送。

    • 例如,A发送数据给B,B在回复数据时,将ACK信息附加在回复的数据包中。

  • 特点

    • 适用于双向通信场景,减少了网络中的小包数量。

    • 提高了网络利用率。


总结

机制 作用 核心原理
应答机制 确认数据接收 接收方发送ACK确认已接收的数据
超时重传机制 解决数据包丢失问题 发送方超时未收到ACK时重传数据
流量控制机制 防止接收方缓冲区溢出 接收方通过窗口大小控制发送方的发送速率
滑动窗口机制 提高数据传输效率 发送方在窗口内连续发送数据,接收方滑动窗口确认数据
延时应答机制 减少ACK数量,提高网络利用率 接收方延迟发送ACK,等待可能的捎带机会
捎带应答机制 减少单独发送ACK的开销 将ACK信息附加在数据包中发送

这些机制共同作用,使得TCP能够在保证可靠性的同时,提高传输效率并适应网络环境的变化。


TCP粘包问题*:

封装自定义数据帧
  • 原理

    • 在每个数据包前添加一个头部,头部包含数据包的长度信息。

    • 接收方先读取头部,获取数据包长度,然后根据长度读取完整的数据包。

相关推荐
北顾南栀倾寒37 分钟前
[杂学笔记]HTTP1.0和HTTP1.1区别、socket系列接口与TCP协议、传输长数据的时候考虑网络问题、慢查询如何优化、C++的垃圾回收机制
网络·c++·笔记·tcp/ip·mysql·http
木下瞳1 小时前
coze 工作流微博关键词爬虫
爬虫
小爬虫程序猿1 小时前
利用Python爬虫按图搜索1688商品(拍立淘):实战指南
爬虫·python·图搜索算法
数据小小爬虫1 小时前
利用Python爬虫按图搜索1688商品(拍立淘)
爬虫·python·图搜索算法
william0820122 小时前
IP地址怎么加密https访问?
服务器·网络协议·tcp/ip·网络安全·https·ssl
了不起的杰2 小时前
【计算机网络03】网络层协议IP(详细)
网络·tcp/ip·计算机网络
Anchenry5 小时前
【Python爬虫】爬取公共交通路网数据
开发语言·爬虫·python
搬码红绿灯6 小时前
计算机网络——IP地址
网络协议·tcp/ip·计算机网络
xyeternals14 小时前
【TCP/IP协议栈】1. TCP/IP协议栈概述(体系、四/五层模型、IP、MAC)
网络·tcp/ip·计算机网络
^_^ 纵歌15 小时前
Ubuntu 22.04 启动登录页面显示 IP 地址
服务器·tcp/ip·ubuntu