网络原理学习笔记:TCP/IP 核心概念
本文是我在学习网络原理时整理的笔记,主要涵盖传输层、网络层和数据链路层的核心协议和概念,特别是 TCP, UDP, IP, 和以太网。
一、传输层 (Transport Layer)
传输层负责提供端到端(进程到进程)的数据传输服务。它建立在网络层之上,为应用层提供通信支持。主要协议有 UDP 和 TCP。
1.1 UDP协议 (User Datagram Protocol)
UDP 是一种简单的、面向数据报的传输层协议。
UDP 报文段格式 (UDP Segment Format):

- 16位源端口号 (Source Port): 标识发送方进程。
- 16位目的端口号 (Destination Port): 标识接收方进程。
- 16位UDP长度 (Length): 表示整个UDP报文段(UDP首部+UDP数据)的总长度(字节),最大为 65535 字节 (理论值,实际受 IP 层限制约为 64KB)。
- 16位检验和 (Checksum): 用于检测 UDP 报文段(首部和数据)在传输中是否出错。如果出错,报文将直接被丢弃。此字段在 IPv4 中可选,但在 IPv6 中是强制的。
UDP的特点:
- 无连接 (Connectionless): 发送数据前无需建立连接。只需知道对方的 IP 和端口号即可发送数据报。
- 不可靠 (Unreliable): 不保证数据报一定到达,不保证顺序,不保证不重复。没有确认机制,没有重传机制。如果因网络问题无法将报文传输给对方,UDP 不会向应用层返回任何错误信息。
- 面向数据报 (Datagram-Oriented): 应用层交给 UDP 多长的报文,UDP 就照样发送,即一次发送一个报文。接收方也一次接收一个完整的报文。它保留了消息的边界,不会发生粘包问题,但可能丢包或乱序。
- 开销小,效率高: 头部只有 8 字节,协议处理简单快速。
1.2 TCP协议 (Transmission Control Protocol)
TCP 的全称为传输控制协议,是一种面向连接的、可靠的、基于字节流的传输层协议。它旨在对数据的传输进行精确控制,确保数据可靠、有序地到达。
TCP 报文段格式 (TCP Segment Format):

- 源/目的端口号 (Source/Destination Port): 各 16 位,表示数据从哪个进程来,要到哪个进程去。
- 32位序号 (Sequence Number -
seq
): 由发送方填充,表示本报文段所发送数据的第一个字节在整个数据流中的字节编号。 - 32位确认序号 (Acknowledgement Number -
ack
): 由接收方填充,表示期望收到对方下一个 报文段数据的第一个字节 的序号。也就是说,序号ack-1
为止的所有数据都已成功接收。仅当ACK
标志位为 1 时有效。 - 4位首部长度 (Header Length / Data Offset): 表示 TCP 首部有多少个 32位字(即多少个 4 字节)。乘以 4 即可得到首部的字节长度。最小值为 5 (20 字节),最大值为 15 (60 字节)。无选项时为 20 字节。
- 6位保留 (Reserved): 保留给以后使用,当前必须置为 0。
- 6位标志位 (Flags):
URG
: 紧急指针(Urgent Pointer)有效。指示报文中有紧急数据,应优先处理。ACK
: 确认序号(Acknowledgement Number)字段有效。建立连接后,所有传送的报文段都必须将ACK
置为 1。PSH
: 推送(Push)功能。接收方接到PSH=1
的报文时,应尽快将数据交付给应用层,而不是等待缓冲区填满。RST
: 重置连接(Reset)。用于异常中断连接(如连接请求到不存在的端口、连接异常)。SYN
: 同步序号(Synchronize)。用于发起连接请求。SYN=1, ACK=0
表示连接请求;SYN=1, ACK=1
表示同意连接。FIN
: 结束连接(Finish)。表示发送方数据已发送完毕,请求断开连接。
- 16位窗口大小 (Window Size): 用于流量控制。表示接收方 当前可用的接收缓冲区的大小(单位是字节)。告知发送方还能发送多少数据。
- 16位检验和 (Checksum): 用于差错检测。覆盖 TCP 首部和数据部分。发送方计算并填充,接收方验证。
- 16位紧急指针 (Urgent Pointer): 只有当
URG
标志位为 1 时,该字段才有效。它是一个偏移量,指出紧急数据在数据部分的结束位置。 - 选项 (Options): 长度可变,最大为 40 字节。用于协商 MSS (Maximum Segment Size)、窗口扩大因子、时间戳等。
- 数据 (Data / Payload): 有效载荷,包含应用层的数据。长度可变。
1.2.1 TCP 核心机制
TCP 通过多种机制来保证可靠性和效率:
-
1. 确认应答 (Acknowledgement - 可靠性):
- 目的: 保证数据的可靠传输,发送方需要知道接收方是否成功收到了数据。
- 机制: 发送方发送数据(携带
seq
),接收方收到后回复一个ACK
报文(携带ack
),ack
值为seq + 数据长度
,表示期望收到的下一个字节序号。
-
2. 超时重传 (Timeout Retransmission - 可靠性):
- 目的: 处理数据包或确认包在网络中丢失的情况。
- 机制:
- 发送丢包: 发送方发送数据后启动一个计时器。如果在计时器到期前未收到对应的
ACK
,则认为数据包丢失,重新发送该数据包。 - 应答丢包: 接收方发送了
ACK
,但在网络中丢失。发送方未收到ACK
,同样会触发超时重传。接收方收到重复的数据包时,根据序号可以识别并丢弃。
- 发送丢包: 发送方发送数据后启动一个计时器。如果在计时器到期前未收到对应的
- 超时时间: TCP 动态计算 RTO (Retransmission Timeout),基于 RTT (Round-Trip Time) 的测量。
- 快速重传: 作为优化,如果发送方收到三个或以上 的重复
ACK
(指示同一个丢失的包),它会不等超时计时器到期就立即重传该数据包。
-
3. 连接管理 (Connection Management - 可靠性):
-
目的: 安全地建立和终止 TCP 连接,确保双方都准备好收发数据,并且所有数据都传输完毕。
-
三次握手 (Three-Way Handshake - 建立连接):
- 客户端 -> 服务器: 发送
SYN
包 (标志位SYN=1
,seq=x
) 请求建立连接。客户端进入SYN_SENT
状态。 - 服务器 -> 客户端: 收到请求后,如果同意连接,则回复
SYN-ACK
包 (标志位SYN=1, ACK=1
,seq=y
,ack=x+1
)。服务器进入SYN_RCVD
状态。 - 客户端 -> 服务器: 收到
SYN-ACK
包后,回复ACK
包 (标志位ACK=1
,seq=x+1
,ack=y+1
)。客户端进入ESTABLISHED
状态。服务器收到此ACK
后也进入ESTABLISHED
状态。连接建立完成。
- 目的: 确认双方的发送和接收能力都正常。
- 客户端 -> 服务器: 发送
-
四次挥手 (Four-Way Handshake - 断开连接):
- 主动方 -> 被动方: 数据发送完毕后,发送
FIN
包 (标志位FIN=1
,seq=u
) 请求关闭连接。主动方进入FIN_WAIT_1
状态。 - 被动方 -> 主动方: 收到
FIN
后,回复ACK
包 (标志位ACK=1
,ack=u+1
,seq=v
)。被动方进入CLOSE_WAIT
状态。主动方收到此ACK
后进入FIN_WAIT_2
状态。(此时被动方可能还有数据要发送) - 被动方 -> 主动方: 当被动方也准备好关闭连接(应用层调用
close
),发送FIN
包 (标志位FIN=1, ACK=1
,seq=w
,ack=u+1
)。被动方进入LAST_ACK
状态。 - 主动方 -> 被动方: 收到被动方的
FIN
后,回复ACK
包 (标志位ACK=1
,seq=u+1
,ack=w+1
)。主动方进入TIME_WAIT
状态(等待 2*MSL 时间,确保最后的ACK
到达对方)。被动方收到此ACK
后进入CLOSED
状态。主动方等待TIME_WAIT
结束后也进入CLOSED
状态。连接断开。
- 目的: 确保双方数据都传输完毕,并各自确认连接关闭。
- 主动方 -> 被动方: 数据发送完毕后,发送
-
-
4. 滑动窗口 (Sliding Window - 效率):
- 目的: 提高传输效率,允许发送方在收到一个
ACK
之前连续发送多个报文段。 - 机制:
- 发送窗口: 发送方维护一个窗口,表示当前允许发送但尚未收到确认的数据范围。收到
ACK
后,窗口向前滑动。 - 接收窗口: 接收方根据自己的缓冲区大小,通过 TCP 头部的 窗口大小 (Window Size) 字段告知发送方自己还能接收多少数据。
- 发送窗口: 发送方维护一个窗口,表示当前允许发送但尚未收到确认的数据范围。收到
- 窗口大小限制了在途(未确认)的数据量。
- 目的: 提高传输效率,允许发送方在收到一个
-
5. 流量控制 (Flow Control - 效率/可靠性):
- 目的: 防止发送方发送数据太快,导致接收方缓冲区溢出而处理不过来。
- 机制: 接收方通过 TCP 头部的 16位窗口大小 (Window Size) 字段,告知发送方自己当前可用的接收缓冲区大小。发送方根据这个值动态调整自己的发送速率,确保发送的数据量不超过接收方的处理能力。如果窗口大小为 0,发送方暂停发送数据(除了探测报文)。
-
6. 拥塞控制 (Congestion Control - 可靠性/效率):
- 目的: 防止过多数据注入网络导致网络拥塞(路由器过载、丢包率增加),维护网络稳定性。
- 机制: TCP 通过感知网络拥塞状况(如丢包、超时)来动态调整拥塞窗口 (
cwnd
) 的大小,从而控制发送速率。与流量控制(点对点)不同,拥塞控制是全局性的考量。主要算法包括:慢启动 (Slow Start)、拥塞避免 (Congestion Avoidance)、快速重传 (Fast Retransmit)、快速恢复 (Fast Recovery)。
-
7. 延迟应答 (Delayed ACK - 效率):
- 目的: 减少网络中纯
ACK
包的数量,降低协议开销。 - 机制: TCP 接收方收到数据后,不立即发送
ACK
,而是稍等片刻 (比如 200ms 或等待有数据要发回时)。如果这段时间内有数据要发给对方,就可以将ACK
捎带在数据包中一起发送。
- 目的: 减少网络中纯
-
8. 捎带应答 (Piggybacking - 效率):
- 目的: 提高传输效率,将数据回复和确认应答合并在一个 TCP 报文段中发送。
- 机制: 当接收方既要发送确认
ACK
,又有数据要发送给对方时,将ACK
信息搭载在包含数据的 TCP 报文段中一起发送,而不是单独发送一个ACK
包。
-
9. 面向字节流 (Byte Stream - 特性):
- 概念: TCP 为上层应用层提供的是一个无边界的、有序的字节流服务。TCP 不关心应用层发送的消息的边界。发送方写入多少次、每次写多少字节,与接收方读取多少次、每次读多少字节没有必然联系。
-
10. 粘包问题 (Sticky Packets - 应用层问题):
- 现象: 由于 TCP 是面向字节流的,接收方从缓冲区读取数据时,可能一次读到了多个应用层消息(粘在一起),或者一个消息的一部分。这被称为"粘包"或"半包"问题。
- 原因: 这是 TCP 字节流特性在应用层数据处理上的体现,并非 TCP 协议本身的错误。
- 解决方案 (应用层): 需要应用层协议自行解决。常见方法有:
- 使用固定长度的消息。
- 在消息之间使用特殊的分隔符(如
\r\n
)。 - 在每个消息头部添加一个字段来表示该消息的长度。
-
11. 异常情况处理 (Exception Handling):
- TCP 设计了处理各种网络异常情况的机制:
- 丢包 (Packet Loss): 通过超时重传 和快速重传机制恢复。
- 包损坏 (Packet Corruption): 通过 16位检验和 (Checksum) 检测。损坏的包会被接收方丢弃,发送方通过超时重传或快速重传机制恢复。
- 失序包 (Out-of-Order Packets): 通过 32位序号 (Sequence Number) 识别。接收方会缓存失序的包,等待中间缺失的包到达后,按序重新组装并交给应用层。
- 重复包 (Duplicate Packets): 通过 序号 识别并直接丢弃。
- 连接重置 (Connection Reset): 如果收到一个指向不存在的连接的报文段,或发生严重错误,TCP 会发送一个带有
RST
标志位的报文段,强制中断连接。在 Java 等应用中,这可能表现为SocketException: Connection reset
。 - 半打开连接 (Half-Open Connection): 一方异常崩溃(如宕机),另一方不知情。当存活方尝试发送数据时,会因为收不到
ACK
而超时,或者如果崩溃方恢复并收到旧连接的数据,可能会回复RST
。
- TCP 设计了处理各种网络异常情况的机制:
1.3 TCP 和 UDP 的对比
特性 | TCP (Transmission Control Protocol) | UDP (User Datagram Protocol) |
---|---|---|
连接性 | 面向连接 (Connection-Oriented) | 无连接 (Connectionless) |
可靠性 | 可靠传输 | 不可靠 (尽力而为 - Best Effort) |
传输单元 | 字节流 (Byte Stream) | 数据报 (Datagram) |
头部开销 | 较大 (至少 20 字节) | 小 (固定 8 字节) |
传输效率 | 相对较低 (因确认、重传等机制) | 相对较高 |
流量控制 | 有 (滑动窗口) | 无 |
拥塞控制 | 有 | 无 |
应用场景 | 文件传输 (HTTP, FTP), 邮件 (SMTP), 远程登录 (Telnet, SSH) 等要求高可靠性的场景 | 实时音视频传输 (RTP), DNS 查询, SNMP, 直播, 游戏等对实时性要求高、能容忍少量丢包的场景, 以及广播/多播 |
应用层问题 | 可能出现粘包问题 (需应用层解决) | 可能出现丢包、乱序 (需应用层处理) |
总结: TCP 和 UDP 没有绝对的优劣之分。它们是程序员可以根据具体应用场景和需求选择的工具。需要可靠性时选 TCP,需要速度和实时性或广播时选 UDP。
二、网络层 (Network Layer)
网络层位于传输层之下,数据链路层之上。
- 核心功能: 实现数据包(Packet/Datagram)在不同网络之间的路由和转发。它负责将数据从源主机传送到目的主机,即使它们位于不同的网络(局域网)中。
- 关键任务:
- 逻辑寻址 (Logical Addressing): 使用 IP 地址 (
IP Address
) 来唯一标识网络中的主机和设备。 - 路由 (Routing): 根据目的 IP 地址,查找路由表 ,决定数据包的下一跳转发路径。路由器 (Router) 是执行此功能的关键设备。
- 转发 (Forwarding): 将数据包从路由器的输入端口移动到合适的输出端口。
- 逻辑寻址 (Logical Addressing): 使用 IP 地址 (
2.1 IP 协议 (Internet Protocol)
IP 协议是网络层的核心协议,是 TCP/IP 协议栈的基石。目前主要有两个版本:IPv4 和 IPv6。这里主要讨论更常用的 IPv4。
- 特点:
- 无连接 (Connectionless): 发送 IP 数据报前不需要建立连接。每个数据报都独立寻址和路由,可能走不同的路径到达目的地。
- 不可靠 / "尽力而为" (Best Effort Delivery): IP 协议不保证数据报一定能到达目的地,不保证按序到达,也不保证数据报在传输过程中不损坏、不丢失或不重复。可靠性由上层协议(如 TCP)负责。
2.1.1 基本概念 (Basic Concepts)
- IP 地址 (IP Address): 一个 32 位(IPv4)或 128 位(IPv6)的数字标识符,用于在网络中唯一标记一台主机或网络接口。IPv4 地址通常写成点分十进制形式(如
192.168.1.1
)。 - 数据报/包 (Datagram/Packet): 网络层传输数据的基本单元,包含 IP 头部 (Header) 和数据载荷 (Payload)。载荷通常是来自上层(如 TCP 或 UDP)的报文段。
- 路由 (Routing): 路由器根据其内部维护的路由表 (Routing Table) ,查找 IP 数据报中的目的 IP 地址 ,决定将该数据报转发给哪个下一跳 (Next Hop) 路由器或直接发送给目标主机(如果目标在本地网络)。
- 分片与重组 (Fragmentation & Reassembly): 当一个 IP 数据报的大小超过了下一跳链路的最大传输单元 (Maximum Transmission Unit - MTU) 时,发送方(或中间路由器,仅限 IPv4)可以将其分割成多个更小的片段(分片)进行传输。每个分片都有自己的 IP 头部。目标主机的 IP 层负责将接收到的所有分片根据标识信息重新组装成原始的数据报。
2.1.2 IP 协议头格式 (IPv4 Header Format)
IPv4 数据报由头部和数据部分组成。头部通常为 20 字节(无选项字段时),包含以下关键信息:
- 版本 (Version): 4 位。指明 IP 协议版本,IPv4 为 4。
- 首部长度 (IHL - Internet Header Length): 4 位。表示 IP 头部有多少个 32位字(4字节)。最小值为 5(即 20 字节),最大为 15(60 字节)。
- 服务类型 (Type of Service - TOS / Differentiated Services - DS): 8 位。用于指示期望的服务质量(如低延迟、高吞吐量)。现多被 DSCP/ECN 字段使用。
- 总长度 (Total Length): 16 位。整个 IP 数据报(头部+数据)的总字节数。最大为 65535 字节。
- 标识 (Identification): 16 位。唯一标识一个数据报。当数据报被分片时,所有分片具有相同的标识号,用于重组。
- 标志 (Flags): 3 位。
- 第 0 位:保留,必须为 0。
- 第 1 位:
DF
(Don't Fragment) -DF=1
表示禁止分片;DF=0
允许分片。 - 第 2 位:
MF
(More Fragments) -MF=1
表示后面还有分片;MF=0
表示这是最后一个分片(或未分片)。
- 片偏移 (Fragment Offset): 13 位。表示该分片的数据部分相对于原始数据报数据部分的偏移量(以 8 字节为单位)。第一个分片的偏移量为 0。
- 生存时间 (Time To Live - TTL): 8 位。数据报在网络中允许经过的最大路由器跳数。每经过一个路由器,TTL 值减 1。当 TTL 减到 0 时,数据报被丢弃,并通常会向源主机发送一个 ICMP 超时消息。防止数据包在网络中无限循环。
- 协议 (Protocol): 8 位。指示 IP 包数据部分承载的是哪个上层协议 。常用值:
1
(ICMP),6
(TCP),17
(UDP)。 - 首部检验和 (Header Checksum): 16 位。用于校验 IP 头部 的完整性(注意:仅校验头部,不校验数据部分)。每经过一个路由器,由于 TTL 等字段会改变,需要重新计算校验和。
- 源 IP 地址 (Source IP Address): 32 位。发送方主机的 IP 地址。
- 目的 IP 地址 (Destination IP Address): 32 位。接收方主机的 IP 地址。
- 选项 (Options): 可变长度 (0 到 40 字节)。用于扩展功能,如记录路由、时间戳等。实际中较少使用,且会增加处理开销。
- 填充 (Padding): 如果选项字段存在且长度不是 4 字节的整数倍,则添加 0 比特进行填充,以确保 IP 头部总长度是 4 字节的整数倍。
2.2 地址管理 (Address Management)
如何有效地分配、组织和使用 IP 地址。
2.2.1 网段划分 (Subnetting)
- 目的: 将一个大的 IP 网络(如 ISP 分配的地址块)划分成多个更小的、逻辑上独立的子网络(Subnet)。这有助于:
- 网络管理: 更方便地管理不同部门或区域的网络。
- 提高效率: 限制广播域,减少网络流量。
- 增强安全性: 在子网间设置访问控制。
- 机制: 通过子网掩码 (Subnet Mask) 来实现。子网掩码是一个 32 位的值,结构与 IP 地址类似,用于区分 IP 地址中的网络部分 和主机部分 。
- 将 IP 地址和子网掩码进行按位与 (AND) 运算,可以得到该 IP 地址所在的网络地址 (Network Address)。
- 子网掩码中,值为
1
的位对应 IP 地址的网络部分,值为0
的位对应 IP 地址的主机部分。
- 示例:
- IP 地址:
192.168.1.100
- 子网掩码:
255.255.255.0
(二进制11111111.11111111.11111111.00000000
) - 网络地址 =
192.168.1.100
AND255.255.255.0
=192.168.1.0
- 在这个例子中,前 24 位 (
192.168.1
) 是网络部分,后 8 位是主机部分。 - 该子网可容纳的主机数 = 2^(主机位数) - 2 = 2^8 - 2 = 254 台。(减去全 0 的网络地址和全 1 的广播地址)。
- IP 地址:
- CIDR (Classless Inter-Domain Routing - 无类别域间路由):
- 使用更灵活的表示法:在 IP 地址后面加上
/
和网络部分的位数 (即子网掩码中1
的个数)。 - 例如,
192.168.1.0/24
表示网络部分是前 24 位,等同于子网掩码255.255.255.0
。 - CIDR 取代了过去 A/B/C 类地址的划分方式,使得 IP 地址分配更加高效。
- 使用更灵活的表示法:在 IP 地址后面加上
2.2.2 特殊的 IP 地址 (Special IP Addresses)
这些地址具有特殊含义,不能分配给普通主机接口:
- 网络地址 (Network Address): 主机部分全为 0 的地址(如
192.168.1.0/24
)。它代表整个子网,不能分配给单个主机。 - 广播地址 (Broadcast Address): 主机部分全为 1 的地址(如
192.168.1.255/24
)。向该地址发送数据包,会到达该子网内的所有主机。 - 回环地址 (Loopback Address):
127.0.0.1
是最常用的回环地址,整个127.0.0.0/8
网段都属于回环地址范围。它代表本机 。发送到回环地址的数据包会直接被本机的 IP 栈接收,常用于网络软件测试或本地进程间通信。域名localhost
通常解析为此地址。 - 全零地址 (Zero Address):
0.0.0.0
。通常表示 "任意" 或 "未知" 地址。- 在服务器绑定监听时,
0.0.0.0
表示监听本机所有可用的网络接口。 - 在 DHCP 客户端请求 IP 地址的初始阶段,源 IP 地址可能使用
0.0.0.0
。
- 在服务器绑定监听时,
- 受限广播地址 (Limited Broadcast Address):
255.255.255.255
。发往此地址的数据包只会广播到发送者所在的物理网段 (广播域) ,不会被路由器转发到其他网络。
2.2.3 IP 地址的数量限制 (IP Address Quantity Limits)
- IPv4: 使用 32 位地址,理论上最多有 2^32 ≈ 43 亿个地址。然而,由于地址分配方式、保留的特殊地址段(如私有地址、回环地址)、网络和广播地址的开销等原因,可用的全球唯一(公网)地址远少于此数,并且已基本耗尽。
- IPv6: 使用 128 位地址,提供 2^128 ≈ 3.4 x 10^38 个地址。这是一个极其庞大的数字,足以满足可预见的未来全球所有设备和应用的需求,是解决 IPv4 地址耗尽问题的根本方案。
2.2.4 私有 IP 地址和公网 IP 地址 (Private and Public IP Addresses)
为了缓解 IPv4 地址耗尽问题,并允许组织内部网络使用 IP 地址而无需向互联网管理机构申请,RFC 1918 定义了以下三段私有 IP 地址 (Private IP Addresses):
- 范围 1:
10.0.0.0
-10.255.255.255
(CIDR:10.0.0.0/8
) - 范围 2:
172.16.0.0
-172.31.255.255
(CIDR:172.16.0.0/12
) - 范围 3:
192.168.0.0
-192.168.255.255
(CIDR:192.168.0.0/16
)
特点:
- 私有地址: 可以在任何组织内部(如家庭、学校、公司局域网)自由使用和重复使用,无需注册。这些地址不能在公共互联网 (Internet) 上进行路由。
- 公网 IP 地址 (Public IP Addresses): 指除了私有地址、特殊地址(回环、广播等)之外的所有 IP 地址。这些地址需要向互联网注册机构(通常通过 ISP)申请获得,是全球唯一的,可以在互联网上直接访问。
NAT (Network Address Translation - 网络地址转换):
- 目的: 允许使用私有 IP 地址的内部网络设备能够访问公共互联网。
- 机制: 通常在连接内部网络和外部互联网的路由器 (NAT 网关)上实现。当内部主机(使用私有 IP)访问外部服务器(使用公网 IP)时,NAT 网关将数据包的源 IP 地址 从私有 IP 替换为网关的公网 IP (通常还需要转换端口号,称为 NAPT 或 PAT)。当外部服务器的响应返回到网关时,网关再根据记录将目的 IP 地址 从公网 IP 换回原来的私有 IP,并将数据包转发给内部主机。
- 优点: 极大地节约了 IPv4 公网地址;提供了一定程度的内部网络安全(内部主机不易被外部直接访问)。
- 缺点: 破坏了端到端的地址透明性;某些依赖端到端连接的应用(如一些 P2P 应用、VoIP)可能需要特殊处理(如 NAT 穿透)。
三、数据链路层 (Data Link Layer)
数据链路层位于物理层之上,网络层之下。
- 主要作用: 负责在同一个局域网 (LAN) 内 的相邻节点之间,或者在两个直接相连的节点 之间(点对点链路),可靠地传输数据帧 (Frame) 。它处理的是节点到节点 (Node-to-Node / Hop-to-Hop) 的通信。
- 核心功能:
- 组帧 (Framing): 将网络层递交下来的数据包(如 IP 数据报)封装成帧,添加数据链路层特定的头部 (Header) 和尾部 (Trailer) 信息。
- 物理寻址 (Physical Addressing): 使用 MAC 地址 (Media Access Control Address) 来标识源和目的设备的网络接口卡 (NIC)。
- 流量控制 (Flow Control): (在某些链路类型上)控制发送速率,防止快的发送方淹没慢的接收方。
- 差错控制 (Error Control): 检测(有时也纠正)在物理线路上传输时可能发生的比特错误。通常通过在帧尾部添加帧检验序列 (Frame Check Sequence - FCS) 来实现检测(如 CRC 校验)。出错的帧通常会被丢弃。
- 介质访问控制 (Media Access Control - MAC): 当多个设备共享同一个传输介质时(如早期的总线型以太网或现在的 Wi-Fi 无线网络),需要一套规则来协调谁可以在何时使用介质发送数据,以避免或解决冲突。常见协议有 CSMA/CD (用于传统以太网) 和 CSMA/CA (用于 Wi-Fi)。
3.1 认识以太网 (Understanding Ethernet)
- 定义: 以太网(Ethernet)是目前应用最广泛的一种局域网 (LAN) 技术标准(IEEE 802.3 系列标准)。它定义了物理层(如线缆类型、接口、信号编码)和数据链路层(如帧格式、MAC 地址、访问控制方法)的规范。
- 特点: 技术成熟、成本低廉、速率多样(从 10 Mbps 到 10 Gbps、40 Gbps、100 Gbps 甚至更高)、易于部署和管理。
- 演进:
- 早期: 使用同轴电缆的总线型结构或集线器 (Hub) 连接,所有设备共享带宽,采用 CSMA/CD 协议避免冲突,工作在半双工模式。
- 现代: 普遍使用交换机 (Switch) 连接设备(通常使用双绞线或光纤)。每个设备连接到交换机的一个独立端口,交换机基于 MAC 地址进行帧转发 。这使得设备通常可以工作在全双工模式(同时收发数据),冲突域被大大缩小(每个端口一个冲突域),极大地提高了网络性能和效率。
3.1.1 以太网帧格式 (Ethernet Frame Format)
以太网传输的基本数据单元是帧 (Frame) 。最常用的是 Ethernet II (也称 DIX Ethernet V2) 帧格式:
字段 | 大小 (Bytes) | 描述 |
---|---|---|
目的 MAC 地址 | 6 | 接收方网络接口卡 (NIC) 的物理地址。可以是单播、多播或广播地址。 |
源 MAC 地址 | 6 | 发送方网络接口卡 (NIC) 的物理地址。 |
类型 (Type) | 2 | 指示帧的数据部分(Payload)承载的是哪种上层协议 (网络层协议)。例如:0x0800 表示 IPv4,0x0806 表示 ARP,0x86DD 表示 IPv6。 |
数据 (Data Payload) | 46 - 1500 | 包含来自上层(网络层)的数据,如 IP 数据报。如果上层数据不足 46 字节,数据链路层会进行填充 (Padding) 以满足最小帧长要求 (64 字节,不含前导码)。 |
帧检验序列 (FCS) | 4 | 对整个帧(从目的 MAC 地址到数据部分结束)进行 CRC (Cyclic Redundancy Check) 循环冗余校验。接收方用它来检测帧在传输过程中是否出现比特错误。 |
注意:
- 最小/最大帧长: 以太网帧(从目的 MAC 到 FCS)的最小长度为 64 字节,最大长度为 1518 字节。
- 前导码 (Preamble) & 帧起始定界符 (SFD): 在物理传输时,每个以太网帧前面还有 7 字节的前导码 (用于时钟同步)和 1 字节的帧起始定界符 (Start Frame Delimiter)(标记帧的开始)。这两个字段共 8 字节,有时不计入帧的正式长度。
- IEEE 802.3 格式: 还有一种稍有不同的 IEEE 802.3 格式,它使用相同的 2 字节字段来表示长度 (Length)(如果值 ≤ 1500 或 1536,取决于具体标准),而不是类型。需要配合 LLC 子层来标识上层协议。现代网络中,Ethernet II 格式更为普遍。
3.1.2 认识 MAC 地址 (Understanding MAC Address)
- 定义: MAC 地址(Media Access Control Address),也称为物理地址 (Physical Address) 或硬件地址 (Hardware Address) 。它是在网络设备(主要是网卡 NIC)出厂时就被烧录在硬件中的一个唯一标识符。
- 格式: 一个 48 位 (6 字节) 的二进制数。通常表示为 12 位的十六进制数,并用冒号 (
:
)、破折号 (-
) 或点 (.
) 分隔开,每 2 位十六进制数为一组(代表 1 字节)。- 示例:
08:00:27:7D:99:A5
或08-00-27-7D-99-A5
或0800.277D.99A5
- 示例:
- 唯一性: 由 IEEE(电气和电子工程师协会)负责管理和分配。
- 前 3 个字节(24 位)是组织唯一标识符 (Organizationally Unique Identifier - OUI),由 IEEE 分配给硬件制造商。
- 后 3 个字节(24 位)由制造商自行分配,确保在其生产的设备中唯一。
- 理论上,全球每个网络接口的 MAC 地址都是唯一的(尽管可以通过软件手段临时修改或伪造)。
- 作用域: MAC 地址主要用于本地局域网 (LAN) 内部 的通信。它用于标识同一广播域 内的具体设备接口。当数据包需要跨越路由器 到达另一个网络时,源和目的 MAC 地址会逐跳改变。
3.2 对比理解 MAC 地址和 IP 地址 (Comparing MAC Address and IP Address)
理解 MAC 地址和 IP 地址的区别与联系对于掌握网络通信至关重要。它们在 TCP/IP 协议栈的不同层级工作,共同完成数据从源到目的的传输。
特性 | MAC 地址 (物理地址) | IP 地址 (逻辑地址) |
---|---|---|
层级 | 数据链路层 (Layer 2) | 网络层 (Layer 3) |
用途 | 在本地网络 (同一广播域) 内唯一标识一个网络接口卡 (NIC) | 在整个互联网或跨网络环境中唯一标识一台主机或路由器接口 |
作用范围 | 本地局域网 (LAN) ,不跨越路由器 | 全局 (公网 IP) 或 跨网络 (私网 IP 需经 NAT) |
地址类型 | 硬件地址 (通常固化在网卡 ROM 中) | 逻辑地址 (软件配置,可手动设置或通过 DHCP 动态获取) |
格式 | 48 位,通常表示为 6 字节十六进制数 | 32 位 (IPv4) 或 128 位 (IPv6),通常表示为点分十进制等 |
分配/管理 | IEEE 分配 OUI 给制造商,制造商分配后半部分 | IANA/RIR/ISP 分配公网地址段,网络管理员分配内部地址 |
变化性 | 通常固定不变 (与硬件绑定),但可被软件修改/伪造 | 可以改变 (主机移动到不同网络时,IP 地址通常会改变) |
谁主要使用 | 交换机 (Switch) - 根据目的 MAC 地址在本地 LAN 内转发帧 | 路由器 (Router) - 根据目的 IP 地址在不同网络间转发数据包 |
数据传输中 | 逐跳改变 (Hop-by-Hop) - 每经过一个路由器,源/目的 MAC 地址都会更新为当前跳发送者和接收者的 MAC 地址 | 端到端不变 (End-to-End) - 源 IP 和目的 IP 地址在整个传输过程中通常保持不变 (NAT 除外) |
简单类比:
- IP 地址 就像你的 家庭住址(例如:XX 市 XX 区 XX 路 XX 号)。这个地址用于跨城市、跨区域的长途通信,标识你的最终目的地,需要邮政系统(相当于路由器)来规划路线。
- MAC 地址 就像你的 身份证号码 或者你家门口的 门牌号。当快递员(相当于数据帧)到达你所在的小区或楼栋(相当于本地网络/子网)时,他需要根据这个更具体的本地标识(门牌号/身份证)找到你本人(具体的网卡)。在一个小区内部(局域网内)找人,可能直接看门牌号就够了,不需要写完整的家庭住址。