网络原理-TCP/IP

网络原理学习笔记:TCP/IP 核心概念

本文是我在学习网络原理时整理的笔记,主要涵盖传输层、网络层和数据链路层的核心协议和概念,特别是 TCP, UDP, IP, 和以太网。

一、传输层 (Transport Layer)

传输层负责提供端到端(进程到进程)的数据传输服务。它建立在网络层之上,为应用层提供通信支持。主要协议有 UDP 和 TCP。

1.1 UDP协议 (User Datagram Protocol)

UDP 是一种简单的、面向数据报的传输层协议。

UDP 报文段格式 (UDP Segment Format):

  • 16位源端口号 (Source Port): 标识发送方进程。
  • 16位目的端口号 (Destination Port): 标识接收方进程。
  • 16位UDP长度 (Length): 表示整个UDP报文段(UDP首部+UDP数据)的总长度(字节),最大为 65535 字节 (理论值,实际受 IP 层限制约为 64KB)。
  • 16位检验和 (Checksum): 用于检测 UDP 报文段(首部和数据)在传输中是否出错。如果出错,报文将直接被丢弃。此字段在 IPv4 中可选,但在 IPv6 中是强制的。

UDP的特点:

  • 无连接 (Connectionless): 发送数据前无需建立连接。只需知道对方的 IP 和端口号即可发送数据报。
  • 不可靠 (Unreliable): 不保证数据报一定到达,不保证顺序,不保证不重复。没有确认机制,没有重传机制。如果因网络问题无法将报文传输给对方,UDP 不会向应用层返回任何错误信息。
  • 面向数据报 (Datagram-Oriented): 应用层交给 UDP 多长的报文,UDP 就照样发送,即一次发送一个报文。接收方也一次接收一个完整的报文。它保留了消息的边界,不会发生粘包问题,但可能丢包或乱序。
  • 开销小,效率高: 头部只有 8 字节,协议处理简单快速。

1.2 TCP协议 (Transmission Control Protocol)

TCP 的全称为传输控制协议,是一种面向连接的、可靠的、基于字节流的传输层协议。它旨在对数据的传输进行精确控制,确保数据可靠、有序地到达。

TCP 报文段格式 (TCP Segment Format):

  • 源/目的端口号 (Source/Destination Port): 各 16 位,表示数据从哪个进程来,要到哪个进程去。
  • 32位序号 (Sequence Number - seq): 由发送方填充,表示本报文段所发送数据的第一个字节在整个数据流中的字节编号
  • 32位确认序号 (Acknowledgement Number - ack): 由接收方填充,表示期望收到对方下一个 报文段数据的第一个字节 的序号。也就是说,序号 ack-1 为止的所有数据都已成功接收。仅当 ACK 标志位为 1 时有效。
  • 4位首部长度 (Header Length / Data Offset): 表示 TCP 首部有多少个 32位字(即多少个 4 字节)。乘以 4 即可得到首部的字节长度。最小值为 5 (20 字节),最大值为 15 (60 字节)。无选项时为 20 字节。
  • 6位保留 (Reserved): 保留给以后使用,当前必须置为 0。
  • 6位标志位 (Flags):
    • URG: 紧急指针(Urgent Pointer)有效。指示报文中有紧急数据,应优先处理。
    • ACK: 确认序号(Acknowledgement Number)字段有效。建立连接后,所有传送的报文段都必须将 ACK 置为 1。
    • PSH: 推送(Push)功能。接收方接到 PSH=1 的报文时,应尽快将数据交付给应用层,而不是等待缓冲区填满。
    • RST: 重置连接(Reset)。用于异常中断连接(如连接请求到不存在的端口、连接异常)。
    • SYN: 同步序号(Synchronize)。用于发起连接请求。SYN=1, ACK=0 表示连接请求;SYN=1, ACK=1 表示同意连接。
    • FIN: 结束连接(Finish)。表示发送方数据已发送完毕,请求断开连接。
  • 16位窗口大小 (Window Size): 用于流量控制。表示接收方 当前可用的接收缓冲区的大小(单位是字节)。告知发送方还能发送多少数据。
  • 16位检验和 (Checksum): 用于差错检测。覆盖 TCP 首部和数据部分。发送方计算并填充,接收方验证。
  • 16位紧急指针 (Urgent Pointer): 只有当 URG 标志位为 1 时,该字段才有效。它是一个偏移量,指出紧急数据在数据部分的结束位置。
  • 选项 (Options): 长度可变,最大为 40 字节。用于协商 MSS (Maximum Segment Size)、窗口扩大因子、时间戳等。
  • 数据 (Data / Payload): 有效载荷,包含应用层的数据。长度可变。

1.2.1 TCP 核心机制

TCP 通过多种机制来保证可靠性和效率:

  • 1. 确认应答 (Acknowledgement - 可靠性):

    • 目的: 保证数据的可靠传输,发送方需要知道接收方是否成功收到了数据。
    • 机制: 发送方发送数据(携带 seq),接收方收到后回复一个 ACK 报文(携带 ack),ack 值为 seq + 数据长度,表示期望收到的下一个字节序号。
  • 2. 超时重传 (Timeout Retransmission - 可靠性):

    • 目的: 处理数据包或确认包在网络中丢失的情况。
    • 机制:
      • 发送丢包: 发送方发送数据后启动一个计时器。如果在计时器到期前未收到对应的 ACK,则认为数据包丢失,重新发送该数据包。
      • 应答丢包: 接收方发送了 ACK,但在网络中丢失。发送方未收到 ACK,同样会触发超时重传。接收方收到重复的数据包时,根据序号可以识别并丢弃。
    • 超时时间: TCP 动态计算 RTO (Retransmission Timeout),基于 RTT (Round-Trip Time) 的测量。
    • 快速重传: 作为优化,如果发送方收到三个或以上 的重复 ACK(指示同一个丢失的包),它会不等超时计时器到期就立即重传该数据包。
  • 3. 连接管理 (Connection Management - 可靠性):

    • 目的: 安全地建立和终止 TCP 连接,确保双方都准备好收发数据,并且所有数据都传输完毕。

    • 三次握手 (Three-Way Handshake - 建立连接):

      1. 客户端 -> 服务器: 发送 SYN 包 (标志位 SYN=1, seq=x) 请求建立连接。客户端进入 SYN_SENT 状态。
      2. 服务器 -> 客户端: 收到请求后,如果同意连接,则回复 SYN-ACK 包 (标志位 SYN=1, ACK=1, seq=y, ack=x+1)。服务器进入 SYN_RCVD 状态。
      3. 客户端 -> 服务器: 收到 SYN-ACK 包后,回复 ACK 包 (标志位 ACK=1, seq=x+1, ack=y+1)。客户端进入 ESTABLISHED 状态。服务器收到此 ACK 后也进入 ESTABLISHED 状态。连接建立完成。
      • 目的: 确认双方的发送和接收能力都正常。
    • 四次挥手 (Four-Way Handshake - 断开连接):

      1. 主动方 -> 被动方: 数据发送完毕后,发送 FIN 包 (标志位 FIN=1, seq=u) 请求关闭连接。主动方进入 FIN_WAIT_1 状态。
      2. 被动方 -> 主动方: 收到 FIN 后,回复 ACK 包 (标志位 ACK=1, ack=u+1, seq=v)。被动方进入 CLOSE_WAIT 状态。主动方收到此 ACK 后进入 FIN_WAIT_2 状态。(此时被动方可能还有数据要发送)
      3. 被动方 -> 主动方: 当被动方也准备好关闭连接(应用层调用 close),发送 FIN 包 (标志位 FIN=1, ACK=1, seq=w, ack=u+1)。被动方进入 LAST_ACK 状态。
      4. 主动方 -> 被动方: 收到被动方的 FIN 后,回复 ACK 包 (标志位 ACK=1, seq=u+1, ack=w+1)。主动方进入 TIME_WAIT 状态(等待 2*MSL 时间,确保最后的 ACK 到达对方)。被动方收到此 ACK 后进入 CLOSED 状态。主动方等待 TIME_WAIT 结束后也进入 CLOSED 状态。连接断开。
      • 目的: 确保双方数据都传输完毕,并各自确认连接关闭。
  • 4. 滑动窗口 (Sliding Window - 效率):

    • 目的: 提高传输效率,允许发送方在收到一个 ACK 之前连续发送多个报文段。
    • 机制:
      • 发送窗口: 发送方维护一个窗口,表示当前允许发送但尚未收到确认的数据范围。收到 ACK 后,窗口向前滑动。
      • 接收窗口: 接收方根据自己的缓冲区大小,通过 TCP 头部的 窗口大小 (Window Size) 字段告知发送方自己还能接收多少数据。
    • 窗口大小限制了在途(未确认)的数据量。
  • 5. 流量控制 (Flow Control - 效率/可靠性):

    • 目的: 防止发送方发送数据太快,导致接收方缓冲区溢出而处理不过来。
    • 机制: 接收方通过 TCP 头部的 16位窗口大小 (Window Size) 字段,告知发送方自己当前可用的接收缓冲区大小。发送方根据这个值动态调整自己的发送速率,确保发送的数据量不超过接收方的处理能力。如果窗口大小为 0,发送方暂停发送数据(除了探测报文)。
  • 6. 拥塞控制 (Congestion Control - 可靠性/效率):

    • 目的: 防止过多数据注入网络导致网络拥塞(路由器过载、丢包率增加),维护网络稳定性。
    • 机制: TCP 通过感知网络拥塞状况(如丢包、超时)来动态调整拥塞窗口 (cwnd) 的大小,从而控制发送速率。与流量控制(点对点)不同,拥塞控制是全局性的考量。主要算法包括:慢启动 (Slow Start)、拥塞避免 (Congestion Avoidance)、快速重传 (Fast Retransmit)、快速恢复 (Fast Recovery)。
  • 7. 延迟应答 (Delayed ACK - 效率):

    • 目的: 减少网络中纯 ACK 包的数量,降低协议开销。
    • 机制: TCP 接收方收到数据后,不立即发送 ACK,而是稍等片刻 (比如 200ms 或等待有数据要发回时)。如果这段时间内有数据要发给对方,就可以将 ACK 捎带在数据包中一起发送。
  • 8. 捎带应答 (Piggybacking - 效率):

    • 目的: 提高传输效率,将数据回复和确认应答合并在一个 TCP 报文段中发送。
    • 机制: 当接收方既要发送确认 ACK,又有数据要发送给对方时,将 ACK 信息搭载在包含数据的 TCP 报文段中一起发送,而不是单独发送一个 ACK 包。
  • 9. 面向字节流 (Byte Stream - 特性):

    • 概念: TCP 为上层应用层提供的是一个无边界的、有序的字节流服务。TCP 不关心应用层发送的消息的边界。发送方写入多少次、每次写多少字节,与接收方读取多少次、每次读多少字节没有必然联系。
  • 10. 粘包问题 (Sticky Packets - 应用层问题):

    • 现象: 由于 TCP 是面向字节流的,接收方从缓冲区读取数据时,可能一次读到了多个应用层消息(粘在一起),或者一个消息的一部分。这被称为"粘包"或"半包"问题。
    • 原因: 这是 TCP 字节流特性在应用层数据处理上的体现,并非 TCP 协议本身的错误。
    • 解决方案 (应用层): 需要应用层协议自行解决。常见方法有:
      • 使用固定长度的消息。
      • 在消息之间使用特殊的分隔符(如 \r\n)。
      • 在每个消息头部添加一个字段来表示该消息的长度。
  • 11. 异常情况处理 (Exception Handling):

    • TCP 设计了处理各种网络异常情况的机制:
      • 丢包 (Packet Loss): 通过超时重传快速重传机制恢复。
      • 包损坏 (Packet Corruption): 通过 16位检验和 (Checksum) 检测。损坏的包会被接收方丢弃,发送方通过超时重传或快速重传机制恢复。
      • 失序包 (Out-of-Order Packets): 通过 32位序号 (Sequence Number) 识别。接收方会缓存失序的包,等待中间缺失的包到达后,按序重新组装并交给应用层。
      • 重复包 (Duplicate Packets): 通过 序号 识别并直接丢弃。
      • 连接重置 (Connection Reset): 如果收到一个指向不存在的连接的报文段,或发生严重错误,TCP 会发送一个带有 RST 标志位的报文段,强制中断连接。在 Java 等应用中,这可能表现为 SocketException: Connection reset
      • 半打开连接 (Half-Open Connection): 一方异常崩溃(如宕机),另一方不知情。当存活方尝试发送数据时,会因为收不到 ACK 而超时,或者如果崩溃方恢复并收到旧连接的数据,可能会回复 RST

1.3 TCP 和 UDP 的对比

特性 TCP (Transmission Control Protocol) UDP (User Datagram Protocol)
连接性 面向连接 (Connection-Oriented) 无连接 (Connectionless)
可靠性 可靠传输 不可靠 (尽力而为 - Best Effort)
传输单元 字节流 (Byte Stream) 数据报 (Datagram)
头部开销 较大 (至少 20 字节) 小 (固定 8 字节)
传输效率 相对较低 (因确认、重传等机制) 相对较高
流量控制 有 (滑动窗口)
拥塞控制
应用场景 文件传输 (HTTP, FTP), 邮件 (SMTP), 远程登录 (Telnet, SSH) 等要求高可靠性的场景 实时音视频传输 (RTP), DNS 查询, SNMP, 直播, 游戏等对实时性要求高、能容忍少量丢包的场景, 以及广播/多播
应用层问题 可能出现粘包问题 (需应用层解决) 可能出现丢包、乱序 (需应用层处理)

总结: TCP 和 UDP 没有绝对的优劣之分。它们是程序员可以根据具体应用场景和需求选择的工具。需要可靠性时选 TCP,需要速度和实时性或广播时选 UDP。

二、网络层 (Network Layer)

网络层位于传输层之下,数据链路层之上。

  • 核心功能: 实现数据包(Packet/Datagram)在不同网络之间的路由和转发。它负责将数据从源主机传送到目的主机,即使它们位于不同的网络(局域网)中。
  • 关键任务:
    • 逻辑寻址 (Logical Addressing): 使用 IP 地址 (IP Address) 来唯一标识网络中的主机和设备。
    • 路由 (Routing): 根据目的 IP 地址,查找路由表 ,决定数据包的下一跳转发路径。路由器 (Router) 是执行此功能的关键设备。
    • 转发 (Forwarding): 将数据包从路由器的输入端口移动到合适的输出端口。

2.1 IP 协议 (Internet Protocol)

IP 协议是网络层的核心协议,是 TCP/IP 协议栈的基石。目前主要有两个版本:IPv4 和 IPv6。这里主要讨论更常用的 IPv4。

  • 特点:
    • 无连接 (Connectionless): 发送 IP 数据报前不需要建立连接。每个数据报都独立寻址和路由,可能走不同的路径到达目的地。
    • 不可靠 / "尽力而为" (Best Effort Delivery): IP 协议不保证数据报一定能到达目的地,不保证按序到达,也不保证数据报在传输过程中不损坏、不丢失或不重复。可靠性由上层协议(如 TCP)负责。

2.1.1 基本概念 (Basic Concepts)

  • IP 地址 (IP Address): 一个 32 位(IPv4)或 128 位(IPv6)的数字标识符,用于在网络中唯一标记一台主机或网络接口。IPv4 地址通常写成点分十进制形式(如 192.168.1.1)。
  • 数据报/包 (Datagram/Packet): 网络层传输数据的基本单元,包含 IP 头部 (Header) 和数据载荷 (Payload)。载荷通常是来自上层(如 TCP 或 UDP)的报文段。
  • 路由 (Routing): 路由器根据其内部维护的路由表 (Routing Table) ,查找 IP 数据报中的目的 IP 地址 ,决定将该数据报转发给哪个下一跳 (Next Hop) 路由器或直接发送给目标主机(如果目标在本地网络)。
  • 分片与重组 (Fragmentation & Reassembly): 当一个 IP 数据报的大小超过了下一跳链路的最大传输单元 (Maximum Transmission Unit - MTU) 时,发送方(或中间路由器,仅限 IPv4)可以将其分割成多个更小的片段(分片)进行传输。每个分片都有自己的 IP 头部。目标主机的 IP 层负责将接收到的所有分片根据标识信息重新组装成原始的数据报。

2.1.2 IP 协议头格式 (IPv4 Header Format)

IPv4 数据报由头部和数据部分组成。头部通常为 20 字节(无选项字段时),包含以下关键信息:

  • 版本 (Version): 4 位。指明 IP 协议版本,IPv4 为 4。
  • 首部长度 (IHL - Internet Header Length): 4 位。表示 IP 头部有多少个 32位字(4字节)。最小值为 5(即 20 字节),最大为 15(60 字节)。
  • 服务类型 (Type of Service - TOS / Differentiated Services - DS): 8 位。用于指示期望的服务质量(如低延迟、高吞吐量)。现多被 DSCP/ECN 字段使用。
  • 总长度 (Total Length): 16 位。整个 IP 数据报(头部+数据)的总字节数。最大为 65535 字节。
  • 标识 (Identification): 16 位。唯一标识一个数据报。当数据报被分片时,所有分片具有相同的标识号,用于重组。
  • 标志 (Flags): 3 位。
    • 第 0 位:保留,必须为 0。
    • 第 1 位:DF (Don't Fragment) - DF=1 表示禁止分片;DF=0 允许分片。
    • 第 2 位:MF (More Fragments) - MF=1 表示后面还有分片;MF=0 表示这是最后一个分片(或未分片)。
  • 片偏移 (Fragment Offset): 13 位。表示该分片的数据部分相对于原始数据报数据部分的偏移量(以 8 字节为单位)。第一个分片的偏移量为 0。
  • 生存时间 (Time To Live - TTL): 8 位。数据报在网络中允许经过的最大路由器跳数。每经过一个路由器,TTL 值减 1。当 TTL 减到 0 时,数据报被丢弃,并通常会向源主机发送一个 ICMP 超时消息。防止数据包在网络中无限循环。
  • 协议 (Protocol): 8 位。指示 IP 包数据部分承载的是哪个上层协议 。常用值:1 (ICMP), 6 (TCP), 17 (UDP)。
  • 首部检验和 (Header Checksum): 16 位。用于校验 IP 头部 的完整性(注意:仅校验头部,不校验数据部分)。每经过一个路由器,由于 TTL 等字段会改变,需要重新计算校验和。
  • 源 IP 地址 (Source IP Address): 32 位。发送方主机的 IP 地址。
  • 目的 IP 地址 (Destination IP Address): 32 位。接收方主机的 IP 地址。
  • 选项 (Options): 可变长度 (0 到 40 字节)。用于扩展功能,如记录路由、时间戳等。实际中较少使用,且会增加处理开销。
  • 填充 (Padding): 如果选项字段存在且长度不是 4 字节的整数倍,则添加 0 比特进行填充,以确保 IP 头部总长度是 4 字节的整数倍。

2.2 地址管理 (Address Management)

如何有效地分配、组织和使用 IP 地址。

2.2.1 网段划分 (Subnetting)

  • 目的: 将一个大的 IP 网络(如 ISP 分配的地址块)划分成多个更小的、逻辑上独立的子网络(Subnet)。这有助于:
    • 网络管理: 更方便地管理不同部门或区域的网络。
    • 提高效率: 限制广播域,减少网络流量。
    • 增强安全性: 在子网间设置访问控制。
  • 机制: 通过子网掩码 (Subnet Mask) 来实现。子网掩码是一个 32 位的值,结构与 IP 地址类似,用于区分 IP 地址中的网络部分主机部分
    • 将 IP 地址和子网掩码进行按位与 (AND) 运算,可以得到该 IP 地址所在的网络地址 (Network Address)
    • 子网掩码中,值为 1 的位对应 IP 地址的网络部分,值为 0 的位对应 IP 地址的主机部分。
  • 示例:
    • IP 地址: 192.168.1.100
    • 子网掩码: 255.255.255.0 (二进制 11111111.11111111.11111111.00000000)
    • 网络地址 = 192.168.1.100 AND 255.255.255.0 = 192.168.1.0
    • 在这个例子中,前 24 位 (192.168.1) 是网络部分,后 8 位是主机部分。
    • 该子网可容纳的主机数 = 2^(主机位数) - 2 = 2^8 - 2 = 254 台。(减去全 0 的网络地址和全 1 的广播地址)。
  • CIDR (Classless Inter-Domain Routing - 无类别域间路由):
    • 使用更灵活的表示法:在 IP 地址后面加上 / 和网络部分的位数 (即子网掩码中 1 的个数)。
    • 例如,192.168.1.0/24 表示网络部分是前 24 位,等同于子网掩码 255.255.255.0
    • CIDR 取代了过去 A/B/C 类地址的划分方式,使得 IP 地址分配更加高效。

2.2.2 特殊的 IP 地址 (Special IP Addresses)

这些地址具有特殊含义,不能分配给普通主机接口:

  • 网络地址 (Network Address): 主机部分全为 0 的地址(如 192.168.1.0/24)。它代表整个子网,不能分配给单个主机。
  • 广播地址 (Broadcast Address): 主机部分全为 1 的地址(如 192.168.1.255/24)。向该地址发送数据包,会到达该子网内的所有主机。
  • 回环地址 (Loopback Address): 127.0.0.1 是最常用的回环地址,整个 127.0.0.0/8 网段都属于回环地址范围。它代表本机 。发送到回环地址的数据包会直接被本机的 IP 栈接收,常用于网络软件测试或本地进程间通信。域名 localhost 通常解析为此地址。
  • 全零地址 (Zero Address): 0.0.0.0。通常表示 "任意" 或 "未知" 地址。
    • 在服务器绑定监听时,0.0.0.0 表示监听本机所有可用的网络接口。
    • 在 DHCP 客户端请求 IP 地址的初始阶段,源 IP 地址可能使用 0.0.0.0
  • 受限广播地址 (Limited Broadcast Address): 255.255.255.255。发往此地址的数据包只会广播到发送者所在的物理网段 (广播域)不会被路由器转发到其他网络。

2.2.3 IP 地址的数量限制 (IP Address Quantity Limits)

  • IPv4: 使用 32 位地址,理论上最多有 2^32 ≈ 43 亿个地址。然而,由于地址分配方式、保留的特殊地址段(如私有地址、回环地址)、网络和广播地址的开销等原因,可用的全球唯一(公网)地址远少于此数,并且已基本耗尽。
  • IPv6: 使用 128 位地址,提供 2^128 ≈ 3.4 x 10^38 个地址。这是一个极其庞大的数字,足以满足可预见的未来全球所有设备和应用的需求,是解决 IPv4 地址耗尽问题的根本方案。

2.2.4 私有 IP 地址和公网 IP 地址 (Private and Public IP Addresses)

为了缓解 IPv4 地址耗尽问题,并允许组织内部网络使用 IP 地址而无需向互联网管理机构申请,RFC 1918 定义了以下三段私有 IP 地址 (Private IP Addresses)

  • 范围 1: 10.0.0.0 - 10.255.255.255 (CIDR: 10.0.0.0/8)
  • 范围 2: 172.16.0.0 - 172.31.255.255 (CIDR: 172.16.0.0/12)
  • 范围 3: 192.168.0.0 - 192.168.255.255 (CIDR: 192.168.0.0/16)

特点:

  • 私有地址: 可以在任何组织内部(如家庭、学校、公司局域网)自由使用和重复使用,无需注册。这些地址不能在公共互联网 (Internet) 上进行路由
  • 公网 IP 地址 (Public IP Addresses): 指除了私有地址、特殊地址(回环、广播等)之外的所有 IP 地址。这些地址需要向互联网注册机构(通常通过 ISP)申请获得,是全球唯一的,可以在互联网上直接访问。

NAT (Network Address Translation - 网络地址转换):

  • 目的: 允许使用私有 IP 地址的内部网络设备能够访问公共互联网。
  • 机制: 通常在连接内部网络和外部互联网的路由器 (NAT 网关)上实现。当内部主机(使用私有 IP)访问外部服务器(使用公网 IP)时,NAT 网关将数据包的源 IP 地址私有 IP 替换为网关的公网 IP (通常还需要转换端口号,称为 NAPT 或 PAT)。当外部服务器的响应返回到网关时,网关再根据记录将目的 IP 地址公网 IP 换回原来的私有 IP,并将数据包转发给内部主机。
  • 优点: 极大地节约了 IPv4 公网地址;提供了一定程度的内部网络安全(内部主机不易被外部直接访问)。
  • 缺点: 破坏了端到端的地址透明性;某些依赖端到端连接的应用(如一些 P2P 应用、VoIP)可能需要特殊处理(如 NAT 穿透)。

数据链路层位于物理层之上,网络层之下。

  • 主要作用: 负责在同一个局域网 (LAN) 内 的相邻节点之间,或者在两个直接相连的节点 之间(点对点链路),可靠地传输数据帧 (Frame) 。它处理的是节点到节点 (Node-to-Node / Hop-to-Hop) 的通信。
  • 核心功能:
    • 组帧 (Framing): 将网络层递交下来的数据包(如 IP 数据报)封装成帧,添加数据链路层特定的头部 (Header)尾部 (Trailer) 信息。
    • 物理寻址 (Physical Addressing): 使用 MAC 地址 (Media Access Control Address) 来标识源和目的设备的网络接口卡 (NIC)。
    • 流量控制 (Flow Control): (在某些链路类型上)控制发送速率,防止快的发送方淹没慢的接收方。
    • 差错控制 (Error Control): 检测(有时也纠正)在物理线路上传输时可能发生的比特错误。通常通过在帧尾部添加帧检验序列 (Frame Check Sequence - FCS) 来实现检测(如 CRC 校验)。出错的帧通常会被丢弃。
    • 介质访问控制 (Media Access Control - MAC): 当多个设备共享同一个传输介质时(如早期的总线型以太网或现在的 Wi-Fi 无线网络),需要一套规则来协调谁可以在何时使用介质发送数据,以避免或解决冲突。常见协议有 CSMA/CD (用于传统以太网) 和 CSMA/CA (用于 Wi-Fi)。

3.1 认识以太网 (Understanding Ethernet)

  • 定义: 以太网(Ethernet)是目前应用最广泛的一种局域网 (LAN) 技术标准(IEEE 802.3 系列标准)。它定义了物理层(如线缆类型、接口、信号编码)和数据链路层(如帧格式、MAC 地址、访问控制方法)的规范。
  • 特点: 技术成熟、成本低廉、速率多样(从 10 Mbps 到 10 Gbps、40 Gbps、100 Gbps 甚至更高)、易于部署和管理。
  • 演进:
    • 早期: 使用同轴电缆的总线型结构或集线器 (Hub) 连接,所有设备共享带宽,采用 CSMA/CD 协议避免冲突,工作在半双工模式。
    • 现代: 普遍使用交换机 (Switch) 连接设备(通常使用双绞线或光纤)。每个设备连接到交换机的一个独立端口,交换机基于 MAC 地址进行帧转发 。这使得设备通常可以工作在全双工模式(同时收发数据),冲突域被大大缩小(每个端口一个冲突域),极大地提高了网络性能和效率。

3.1.1 以太网帧格式 (Ethernet Frame Format)

以太网传输的基本数据单元是帧 (Frame) 。最常用的是 Ethernet II (也称 DIX Ethernet V2) 帧格式:

字段 大小 (Bytes) 描述
目的 MAC 地址 6 接收方网络接口卡 (NIC) 的物理地址。可以是单播、多播或广播地址。
源 MAC 地址 6 发送方网络接口卡 (NIC) 的物理地址。
类型 (Type) 2 指示帧的数据部分(Payload)承载的是哪种上层协议 (网络层协议)。例如:0x0800 表示 IPv4,0x0806 表示 ARP,0x86DD 表示 IPv6。
数据 (Data Payload) 46 - 1500 包含来自上层(网络层)的数据,如 IP 数据报。如果上层数据不足 46 字节,数据链路层会进行填充 (Padding) 以满足最小帧长要求 (64 字节,不含前导码)。
帧检验序列 (FCS) 4 对整个帧(从目的 MAC 地址到数据部分结束)进行 CRC (Cyclic Redundancy Check) 循环冗余校验。接收方用它来检测帧在传输过程中是否出现比特错误。

注意:

  • 最小/最大帧长: 以太网帧(从目的 MAC 到 FCS)的最小长度为 64 字节,最大长度为 1518 字节。
  • 前导码 (Preamble) & 帧起始定界符 (SFD): 在物理传输时,每个以太网帧前面还有 7 字节的前导码 (用于时钟同步)和 1 字节的帧起始定界符 (Start Frame Delimiter)(标记帧的开始)。这两个字段共 8 字节,有时不计入帧的正式长度。
  • IEEE 802.3 格式: 还有一种稍有不同的 IEEE 802.3 格式,它使用相同的 2 字节字段来表示长度 (Length)(如果值 ≤ 1500 或 1536,取决于具体标准),而不是类型。需要配合 LLC 子层来标识上层协议。现代网络中,Ethernet II 格式更为普遍。

3.1.2 认识 MAC 地址 (Understanding MAC Address)

  • 定义: MAC 地址(Media Access Control Address),也称为物理地址 (Physical Address)硬件地址 (Hardware Address) 。它是在网络设备(主要是网卡 NIC)出厂时就被烧录在硬件中的一个唯一标识符
  • 格式: 一个 48 位 (6 字节) 的二进制数。通常表示为 12 位的十六进制数,并用冒号 (:)、破折号 (-) 或点 (.) 分隔开,每 2 位十六进制数为一组(代表 1 字节)。
    • 示例: 08:00:27:7D:99:A508-00-27-7D-99-A50800.277D.99A5
  • 唯一性: 由 IEEE(电气和电子工程师协会)负责管理和分配。
    • 前 3 个字节(24 位)是组织唯一标识符 (Organizationally Unique Identifier - OUI),由 IEEE 分配给硬件制造商。
    • 后 3 个字节(24 位)由制造商自行分配,确保在其生产的设备中唯一。
    • 理论上,全球每个网络接口的 MAC 地址都是唯一的(尽管可以通过软件手段临时修改或伪造)。
  • 作用域: MAC 地址主要用于本地局域网 (LAN) 内部 的通信。它用于标识同一广播域 内的具体设备接口。当数据包需要跨越路由器 到达另一个网络时,源和目的 MAC 地址会逐跳改变

3.2 对比理解 MAC 地址和 IP 地址 (Comparing MAC Address and IP Address)

理解 MAC 地址和 IP 地址的区别与联系对于掌握网络通信至关重要。它们在 TCP/IP 协议栈的不同层级工作,共同完成数据从源到目的的传输。

特性 MAC 地址 (物理地址) IP 地址 (逻辑地址)
层级 数据链路层 (Layer 2) 网络层 (Layer 3)
用途 本地网络 (同一广播域) 内唯一标识一个网络接口卡 (NIC) 整个互联网或跨网络环境中唯一标识一台主机或路由器接口
作用范围 本地局域网 (LAN)不跨越路由器 全局 (公网 IP) 或 跨网络 (私网 IP 需经 NAT)
地址类型 硬件地址 (通常固化在网卡 ROM 中) 逻辑地址 (软件配置,可手动设置或通过 DHCP 动态获取)
格式 48 位,通常表示为 6 字节十六进制数 32 位 (IPv4) 或 128 位 (IPv6),通常表示为点分十进制等
分配/管理 IEEE 分配 OUI 给制造商,制造商分配后半部分 IANA/RIR/ISP 分配公网地址段,网络管理员分配内部地址
变化性 通常固定不变 (与硬件绑定),但可被软件修改/伪造 可以改变 (主机移动到不同网络时,IP 地址通常会改变)
谁主要使用 交换机 (Switch) - 根据目的 MAC 地址在本地 LAN 内转发帧 路由器 (Router) - 根据目的 IP 地址在不同网络间转发数据包
数据传输中 逐跳改变 (Hop-by-Hop) - 每经过一个路由器,源/目的 MAC 地址都会更新为当前跳发送者和接收者的 MAC 地址 端到端不变 (End-to-End) - 源 IP 和目的 IP 地址在整个传输过程中通常保持不变 (NAT 除外)

简单类比:

  • IP 地址 就像你的 家庭住址(例如:XX 市 XX 区 XX 路 XX 号)。这个地址用于跨城市、跨区域的长途通信,标识你的最终目的地,需要邮政系统(相当于路由器)来规划路线。
  • MAC 地址 就像你的 身份证号码 或者你家门口的 门牌号。当快递员(相当于数据帧)到达你所在的小区或楼栋(相当于本地网络/子网)时,他需要根据这个更具体的本地标识(门牌号/身份证)找到你本人(具体的网卡)。在一个小区内部(局域网内)找人,可能直接看门牌号就够了,不需要写完整的家庭住址。
相关推荐
威视锐科技4 小时前
软件定义无线电36
网络·网络协议·算法·fpga开发·架构·信息与通信
二进制人工智能4 小时前
【QT5 网络编程示例】TCP 通信
网络·c++·qt·tcp/ip
此刻我在家里喂猪呢7 小时前
qt介绍tcp通信
qt·tcp/ip
落笔画忧愁e7 小时前
VRRP协议
网络·智能路由器
iOS技术狂热者8 小时前
使用抓包大师(sniff master)进行手机端iOS抓包的配置步骤
websocket·网络协议·tcp/ip·http·网络安全·https·udp
卓应8 小时前
2025年华为H31-831题库
网络·华为
山楂树の9 小时前
计算机网络 TCP/IP参考模型
网络·tcp/ip·计算机网络
卓应11 小时前
2025年华为HCIP题库分享
网络·华为·智能路由器
CryptoPP11 小时前
基于WebSocket的金融数据实时推送系统架构设计对接多国金融数据API
websocket·网络协议·金融·系统架构·区块链
WoTrusSSL12 小时前
SSL证书如何保障人脸识别系统安全?
网络协议·系统安全·ssl