Linux 网络基础之数据链路层（十三）认识以太网，认识MAC地址和MTU，局域网(以太网)通信原理

我们可以简单理解为，数据包一旦交付到数据链路层，就等同于交给了网卡。网卡属于底层物理硬件，我们不对网卡等硬件做深入探讨，因此我们就可以认为数据报文抵达数据链路层时，就相当于即将被发送到网络中了。
网络层 IP 协议负责实现跨网络寻址 ，我们曾经说过网络 IP 层提供了一种能力，一种将数据从一台主机跨越多个网络、路由送达另一台主机的能力；而**传输层 TCP 协议则提供了一种兜底的策略，**通过重传、确认等机制，提供兜底的可靠传输策略，确保数据完整、有序地送达目标主机。

链路层对接网卡、IP 管跨网路由、TCP 管可靠送达，是计算机网络最经典的三层分工。

如上图，我们以图中主机 B 向主机 C 发送数据为例，来理解跨网络通信的本质。主机 B 并不会直接把数据发给远在另一端的主机 C，而是先将数据发送给自己所在局域网的出口路由器 F；随后路由器 F 转发给路由器 G，路由器 G 再转发给路由器 H，以此接力，最终经由路由器 D 送达主机 C。

我们会发现：主机 B 与路由器 F、路由器 F 与 G、G 与 H、H 与后续路由器、路由器 D 与主机 C...... 任意两个直连设备之间，两两都属于一段独立的局域网。所以跨网络通信的本质就是一段段局域网首尾串联、路由器逐跳接力的过程。

在物理线路上真正传输的，并不是网络层的 IP 报文，也不是传输层的 TCP 报文，而是数据链路层封装好的数据帧------ 每一段局域网内，都要把上层 IP 报文封装成数据帧，依靠 MAC 地址完成链路层传输。

因此从宏观视角看，这是一次跨越多个网络的端到端通信；但落到底层执行层面，所有互联网通信最终都能拆解为一段段局域网之间的通信。也正因如此，我们要深入网络原理，必须先吃透局域网通信；而局域网里最经典、应用最广的标准，就是以太网，我们接下来就以以太网为核心，正式学习数据链路层的工作机制。

二、以太网之数据链路层

认识以太网

首先我们要明确：以太网并不是某一台、某一片具体的网络，而是一套通用的局域网技术标准。 它同时定义了数据链路层规则与部分物理层规范，从网络拓扑结构、介质访问控制方式，到传输速率、硬件线缆都做了统一约定。比如我们日常使用的网线必须采用双绞线，以太网支持 10M、100M、1000M 乃至万兆等不同传输速率，都属于这套标准的范畴。

**以太网也是目前全球应用最广泛的局域网技术，**在早期局域网发展中，还存在令牌环网、无线 LAN 等同类技术，但经过技术迭代与市场淘汰，以太网凭借简单高效、兼容性强的优势，成为了局域网的绝对主流。

从发展历史来看，网络世界是先诞生局域网，后出现广域网、互联网的。早期不同地区各自发展局域网技术，方案五花八门，最终以太网脱颖而出，成为统一的底层局域网标准。可以说没有以太网，就没有现代互联网------ 互联网本质是无数局域网通过路由器互联而成，而以太网作为局域网的基石，构成了整个互联网的底层通信底座，所有跨网络传输，最终都要依靠以太网完成每一段局域网内的数据交付。

再看上面这幅图，从网络层（IP 层）视角来看，发送方发送的、路由器路由的、接收方收到的 IP 报文都是一样的** ，报文的源 IP 与目的 IP 全程不变，IP 报文本身也不会被修改；但到数据链路层时** ，每经过一段局域网或一台路由器，MAC 地址头部都会被解封装、重新封装------ 源 MAC、目的 MAC 会随链路不断更换，底层甚至可能一边是以太网帧、另一边是令牌环网帧，链路层格式完全不同。

这正是网络 IP 层最关键的作用：网络 IP 层能屏蔽底层数据链路层的差异。无论底层局域网是以太网、令牌环网还是其他局域网，网络层的 IP 报文格式始终统一，上层只需关注 IP 寻址与路由，不用关心底层链路的具体实现，真正实现了跨异构网络的互联互通。

再看上面这幅图，网络的真实通信场景如上图 : 用户 A 发出的数据，会自上而下经过本机应用层→传输层→网络层→数据链路层 ，由网卡发出；随后经过多台路由器逐跳转发 ------ 每台路由器都会在数据链路层解封装、网络层查询路由、再重新封装数据帧发往下一跳；最终数据抵达用户 B，自下而上逐层解包，交付给上层应用。整条链路中，每一段局域网可以是不同类型的链路技术，全程由 IP 协议统一调度。

所以我们能得出下面两个结论 :

结论 1：底层链路差异，对上层编程完全透明

无论底层局域网是以太网、无线 LAN、令牌环网，站在网络 IP 层、传输层、乃至应用层 的视角，通信行为没有任何区别。也就是说上层应用只需要通过 Socket 套接字、Linux 系统调用 发起网络请求，只需要指定目标 IP 与端口，不需要关心底层是网线、WiFi 还是其他老式局域网技术。操作系统内核会自动完成 IP 报文与不同链路帧的封装、转发，底层差异完全被内核屏蔽，因此我们编写网络程序时，无需区分底层硬件与链路类型，一套 Socket 代码就能适配所有网络环境。

结论 2：手机与电脑跨链路通信的本质

比如现实生活中手机能和电脑通信，手机是无线 WiFi (无线 LAN) 的，电脑是以太网，二者能通信的核心原因是双方都遵循统一的 IP 协议 。以太网与无线 LAN 只是数据链路层的不同实现，IP 层会统一封装数据：电脑发出的 IP 报文被封装为以太网帧，经路由器转发后，到达手机所在局域网时，会被重新封装为无线帧；全程 IP 报文格式、寻址规则保持一致。正是 IP 协议抹平了有线与无线的底层差异，让异构设备可以互联互通。

三、以太网帧格式

正如我们前面所说，以太网是一套统一的局域网通信技术标准，在以太网环境中传输数据，必须遵循以太网规定的帧格式进行封装。

如上图，我们来看标准的以太网帧的格式：它由目的地址 (6 字节)、源地址 (6 字节)、类型 (2 字节)、数据 (46~1500 字节)、CRC 校验 (4 字节) 五部分组成。其中目的地址、源地址就是 MAC 地址，用来标识局域网内的接收方与发送方；类型字段用来标记上层数据类型，比如 0x0800 代表数据是IP 报文、0x0806 代表是ARP 报文；末尾 CRC 用来做差错校验，保证帧传输无误。

帧里的数据载荷 ，绝大多数场景是网络层交付下来的 IP 数据报文，同时也可以是 ARP、RARP 这类控制报文。

叫法习惯上，我们既可以叫它以太网帧，也常称它为 MAC 帧------ 因为帧头核心就是 MAC 地址寻址，两种叫法都可以，日常表述里以太网帧 更侧重技术标准，MAC 帧更侧重二层 MAC 寻址的本质。

还是老问题

1. 如何分离帧头 (报头) 与有效载荷？

以太网帧采用固定长度帧头 + 固定尾部的设计，接收方可以直接按字节偏移精准拆分：

帧头 (MAC 帧头) 固定 6 字节目的 MAC 地址 + 6 字节源 MAC 地址 + 2 字节类型字段 = 14 字节；

帧尾的 CRC 校验固定为 4 字节；

因此接收方收到数据后，直接跳过前 14 字节帧头、截断末尾 4 字节 CRC 校验，中间剩下的所有内容就是上层有效载荷。

帧头中的目的 MAC、源 MAC 仅在当前局域网内有效，一旦数据经过路由器转发，MAC 地址就会被重新封装、改写，无法跨网络传递；只有 IP 地址可以实现全网端到端寻址。

2.接收方如何分用？

接收方通过帧头中 2 字节的类型字段 判断载荷类型，完成向上交付的分用：

类型值为 0x0800：载荷是IP 数据报，交付给网络层 IP 协议处理；

类型值为 0x0806：载荷是ARP 请求/应答报文，交付给 ARP 协议层处理；

类型值为 0x0835：载荷是 RARP 报文，对应反向地址解析。

简单说，2 字节类型字段就是以太网帧的 "上层标识"，用来告诉网卡和内核：收到的数据该交给哪个上层协议。

三、认识 MAC 地址

我们首先要知道的是 :

(1). 任何一台主机都隶属于某一个局域网 (2). 任何一台主机想要接入网络上网，内部必须配备网卡；每一块网卡在出厂时，都会内置一个 48 比特位 (6 字节) 的 MAC 地址，用来标识这台主机在当前局域网内的唯一身份。

什么是 MAC 地址?

MAC 地址本质是数据链路层中用于识别相邻网络节点的硬件地址， 标准长度为 48 位、共 6 字节，日常以十六进制 + 冒号的格式表示，例如 08:00:27:03:fb:19。

MAC 地址的核心特点是：地址在网卡出厂时就已固化写入硬件，理论上全球唯一；仅在当前局域网内生效，无法跨网络传递，经过路由器转发时会被重新封装修改。需要补充的是，虚拟机的虚拟 MAC 并非真实硬件地址，存在冲突可能，部分网卡也支持手动修改 MAC 地址。

对比理解MAC地址和IP地址

我们可以通俗对比 MAC 地址与 IP 地址：IP 地址描述的是端到端通信中，整条传输路途的总起点与总终点 ，全程保持不变，负责跨全网寻址；而 MAC 地址描述的是传输路径上，每一段局域网链路的起点与终点，只在单段局域网内有效，每经过一台路由器、一段链路就会发生改变。二者分工配合，共同完成互联网的数据传输。

很多人都会混淆 MAC 地址和 IP 地址都是用来标识主机唯一性的，那它们到底有什么区别?

首先，MAC 地址只保证局域网内唯一。它是网卡出厂自带的硬件编号，只在家、办公室这一小片局域网里生效，交换机靠它找设备；一旦数据跨路由器、跨网络，MAC 地址就会被不断改写，因此 MAC 地址出不去当前的局域网。

而 IP 地址保证全网范围内唯一。它不是硬件自带的，是网络分配给主机的逻辑地址，能跨越路由器、跨越整个互联网，用来定位端到端的起点和终点------ 也就是从你电脑，到地球另一端服务器的完整地址，全程不会变。

之所以互联网必须同时有这两个地址，是因为分工不同：

IP 地址负责宏观指路 ：告诉数据 "最终要从 A 主机到 C 主机"，解决跨网络、跨广域网的寻址问题；

MAC 地址负责微观跑腿 ：在每一小段局域网里，告诉数据 "这一跳要发给哪个网卡"，解决局域网内部、直连设备之间的交付问题。
我们可以通过系统命令直观看到设备的 MAC 地址：在 Windows 中执行网络查询，会显示物理地址，这正是网卡的 MAC 地址，图中为 1C-83-41-CF-BE-32，以短横线分隔；而在 Linux 中使用 ifconfig 命令，会通过 ether 字段展示 MAC 地址，上图中云服务器的 MAC 地址为 52:54:00:0f:f8:8a，以冒号分隔。

二者本质完全一致，只是系统展示格式不同：Windows 习惯用短横线分隔，Linux 用冒号分隔，都代表对应网卡的 48 位硬件 MAC 地址，用于在局域网内标识设备身份。

认识MTU

MTU（最大传输单元）本质是数据链路层对单次传输数据包大小的硬性限制，可以理解为快递对包裹尺寸的上限规定，不同链路标准的 MTU 各不相同。

以我们学习的以太网为例，以太网帧规定数据载荷范围为 46~1500 字节：其中最大值 1500 字节，就是以太网的 MTU；如果上层数据（比如 ARP 报文）不足 46 字节，必须在末尾填充冗余数据补齐，保证帧长度合规

MTU对IP协议的影响

当 IP 报文长度超过当前链路 MTU 时，IP 协议必须对数据包分片：把大 IP 包拆成多个小包，给每个分片打上相同标识、分片标记，到达接收方后再按顺序重组还原。需要注意，IP 分片后任意一个小包丢失，整体重组就会失败 ，而 IP 层本身不负责重传，重传要依赖上层 TCP 协议完成。也正是因为 MTU 带来的分片需求，IP 协议才设计了4 位首部长度、16 位总长度字段，用来标识 IP 头大小与完整数据包长度，实现分片与重组。

在 Linux 系统中执行ifconfig，我们能直接看到网卡mtu 1500，就是以太网的这个上限值。

四、局域网通信原理

以太网通信原理(传统共享式以太网)

以太网的通信，本质限定在同一个局域网内部。如上图，比如主机 A 向主机 E 发送数据时，数据会被封装成以太网帧(MAC帧)并广播发送到整个局域网 ，局域网内的所有主机 (主机 B、C、D、E) 都会收到这一帧数据。每台主机收到数据帧后，都会读取帧头中的目的 MAC 地址进行判断：如果目的 MAC 和自身网卡的 MAC 地址一致，就收下数据并向上层交付；如果不一致，就直接丢弃该帧。正因如此，我们看起来像是只有主机 A 和主机 E 在一对一通信，但实际是数据被全网广播、其他主机自动过滤丢弃，才形成了 "点对点传输" 的错觉。

混杂模式与局域网抓包:

在正常局域网通信中，主机收到以太网帧后，会核对目的 MAC 地址 ，不是发给自己的报文就会丢弃。而混杂模式 是网卡的一种特殊工作模式：开启后网卡不再校验目的 MAC 地址，局域网内所有广播过来的报文，无论目标是谁，都会直接接收并向上层交付。此时如果有黑客控制了一个主机并开启混杂模式，就能捕获局域网内所有传输数据，实现抓包监听，这也是局域网环境中常见的网络窃听风险。

传统共享式以太网

碰撞域与冲突处理

传统的以太网是共享式网络 ，所有主机共用同一根传输线路，如果一个以太网内有多个主机两两要通信，就会出现数据干扰，所以我们把以太网也叫碰撞域，一旦同一时刻如果多台主机同时发送数据，信号会在线路上互相干扰，产生数据碰撞 (冲突) ，导致传输失败。因此参与碰撞的主机就要进行碰撞检测和避免。为此以太网采用 CSMA/CD (载波监听、多路访问、冲突检测) 机制：主机发送前先监听线路是否空闲，空闲才发送；发送中检测到冲突，会立刻停止传输、随机延迟一段时间后重发。这就是链路层的硬件级重传机制，由网卡硬件自动完成，无需上层软件处理。

从系统视角来看，以太网可以看成是一个共享资源，任意时刻只允许一台主机发送数据，本质是对共享链路的互斥访问，避免多主机同时发送引发冲突。

所以会衍生出两个问题

1. 数据帧长度的长短影响碰撞概率吗？

在传统共享式以太网中，数据帧的长度会影响碰撞概率与传输效率。帧越长，发送一次占用共享链路的时间就越长，多台主机同时发送导致冲突的概率也越高；一旦发生碰撞，整个长帧都需要重传，会带来很高的传输代价。因此以太网设计了MTU（最大传输单元），限制单次发送的数据长度（以太网为 1500 字节），正是为了在传输效率与碰撞代价之间找到平衡点。传统的以太网通过CSMA/CD 机制 实现载波监听、冲突检测与随机退避，本质上是让主机在链路空闲时发送数据，冲突时随机延迟重发，从而在共享链路上实现有序传输。

因此把大报文拆成多个短帧发送，而不是一次发送超长数据，核心目的就是减少单次占用链路的时间，为其他主机留出更多传输间隙，降低碰撞概率，提升整体网络效率。这就像把一次 10000 字节的传输拆成 10 次 1000 字节的传输，既避免了长时间独占链路，也减少了单次碰撞带来的重传成本。反过来，如果帧太小，虽然碰撞概率低，但会导致大量的帧头开销，同样会降低整体效率。

2. 主机数的增多问题

在传统共享式以太网中，整个局域网是同一个碰撞域，所有主机共享同一条传输线路。当局域网内主机数量不断增多，同时发送数据的主机变多，数据碰撞的频率会大幅上升，大量报文冲突、重传，网络就会明显卡顿，就像教室下课大家同时上网，网络拥堵、网速变慢。

为了解决主机增多带来的碰撞拥堵问题，我们引入了交换机，正式进入现代交换式以太网时代。交换机工作在数据链路层，核心作用是划分碰撞域 ：交换机的每一个独立端口都是一个单独的碰撞域。当主机 A 向主机 E 发送数据时，交换机会读取帧中的目的 MAC 地址，只把数据精准转发到目标主机 E 所在的端口，不会广播给其他所有主机。

这样一来，不同端口的通信互相隔离、互不干扰，不会再发生全网范围的数据碰撞，从根源上解决了主机增多带来的冲突问题，也让以太网可以承载更多设备，稳定高效地运行。

补充一下 : 其实随着现代交换式以太网的普及，交换机的每个端口都是独立的冲突域，全网级的碰撞概率已经极低，用户几乎感知不到；但网络卡顿、网速变慢的现象，很多时候并不是因为传统意义上的冲突，而是由网络拥塞、丢包、延迟等其他因素导致的。

现代交换机式以太网

什么是交换机?

我们上面讲的是传统的共享式以太网（集线器 HUB） ：所有主机接在同一根总线、同一个大碰撞域里，只要两台主机同时发数据，全网就会冲突 ，所有主机都受影响。而交换机 的每一个物理接口(插网线的口) 都是一条独立、互不干扰的链路 ，也就是独立碰撞域。

什么是交换机的独立端口？

交换机的独立端口就是交换机上插网线的一个个网口，比如 eth_left、eth_right。每个端口独享一条线路、独立收发，和别的端口物理上互不争抢通道。

怎么理解 "每个端口是单独碰撞域"？

只有同一个端口连接的设备之间，才会可能发生碰撞；不同端口之间是完全隔离的。

举个例子：主机 A 在交换机的端口 1、主机 E 在端口 5。当主机 A 发数据给主机 E 时，交换机只在端口 1 和端口 5 之间传输，端口 2、3、4 不受影响，其他主机通信照常进行。也就是说冲突只会发生在单个端口内部，不会扩散到整个局域网。
并且交换机的一个端口也可以接多台主机 ，比如在交换机端口上再接一个集线器（HUB），就能连好几台电脑。但要注意的是只要多台主机共享交换机的同一个端口，它们就重新回到同一个碰撞域里 。也就是说，交换机只保证不同端口之间互相隔离、不会冲突 ；但同一个端口下的所有设备，依然属于同一个碰撞域 ，多台主机同时发数据，还是会发生碰撞、互相干扰。所以我们现在组网时，都是一台主机直接连交换机一个独立端口，让每台主机独占一个碰撞域，彻底避免冲突。

一个电脑主机配一个交换机吗？

不是的，一台交换机上有很多个独立端口，比如常见的 5 口、8 口、24 口交换机。我们的正确接法是每一台电脑，单独插交换机上的一个端口。一台 8 口交换机，就能直接接 8 台电脑，每台电脑独占一个端口、独占一个独立碰撞域，互相之间不会冲突。只有当我们在同一个端口下再接集线器、再接多台电脑时，这些电脑才会回到同一个碰撞域。正常组网里，我们只需要一台交换机，分给多台主机一人一个端口，既省钱，又能彻底解决碰撞卡顿问题。

那交换机一般是配置在哪？

交换机普通家庭一般不会单独额外部署 ，我们家里用的光猫、无线路由器，已经内置了交换机功能 。家里的路由器背后那 4 个 LAN 口，本质就是一台小型交换机，电脑、电视直接插上去，每台设备独占一个端口、独立碰撞域，互不冲突，不用额外买交换机。

交换机真正的部署场景，主要是设备多的地方 ：比如公司、教室、宿舍、机房，几十上百台电脑，路由器口不够用，就会单独放一台交换机，扩展网口。它一般部署在弱电箱、机房、办公桌旁，所有电脑网线统一接到交换机上，再由交换机连路由器上网。

交换机原理

我们通过一个例子来理解交换机的原理:

交换机刚上电，也就是刚启动时，交换机内部是没有任何主机的信息的(MAC 地址表是空的)。交换机不知道各个主机的 MAC 地址分别对应哪个端口。比如当主机 A 要给主机 E 发送数据帧时，帧里会明确标注源 MAC 地址MacA、目的 MAC 地址MacE。数据到达交换机后，交换机会先读取源 MAC 地址 MacA，立刻在自己的 MAC 地址表里记录：MacA → 左侧eth_left端口，完成一次地址记录。但此时交换机查表，找不到 MacE 对应的端口，它开始是不知道主机 E 连在哪个口。这种情况下，交换机无法精准转发，只能执行泛洪（广播转发）：把这份数据帧，向除了来源端口之外，所有其他端口全部复制发送出去。也就是除了 A 所在的左侧端口，右侧所有端口都会收到这份数据，这就是泛洪。
泛洪之后，右侧的主机 E 收到数据，识别到目的 MAC 是自己，接收并处理；其他主机识别 MAC 地址与自己不符，就直接丢弃。之后主机 E 要回复主机 A，回复帧的源 MAC 变成 MacE、目的 MAC 变成 MacA。这份回复帧进入交换机后，交换机再次做地址学习：记录MacE → 右侧eth_right端口。
随着局域网里每台主机收发数据，交换机都会不断学习，慢慢把 MacB、MacD、MacC 等所有 MAC 地址和对应端口都记进 MAC 地址表。后续比如主机 A 和主机 C 通信时，交换机查表发现：MacA 和 MacC 都在左侧端口，于是只在左侧端口内部转发，就不会再往右侧端口发送；如果是左右跨端口通信，就只连通对应的两个端口，不再全网泛洪。
这里要注意的是，主机 A、B、D 全部都接在交换机同一个左侧端口 eth_left，主机 C、E 接在同一个右侧端口 eth_right。因为交换机的规则是同一个物理端口下的所有设备，共享同一个碰撞域；只有不同端口之间才互相隔离碰撞域。所以主机 A、B、D 都在左侧 eth_left 这同一个碰撞域里：如果 A 和 B 同时发消息，就会在这条链路上发生数据碰撞；同理，右侧端口下的主机 C 和 E 同时发消息，也会在右侧链路里产生碰撞。但左右两侧端口之间是完全隔离的，左侧 A、B 通信产生的碰撞，不会影响右侧 C、E 的通信；两边可以同时传输数据、互不干扰。只有当我们把每一台主机都单独接交换机的一个独立端口，每台设备独占一个碰撞域，才能避免碰撞。

五、总结

本文深入讲解了数据链路层的核心概念和工作原理。首先介绍了数据链路层在网络协议栈中的定位，它负责将网络层数据封装成帧并通过网卡发送。重点分析了以太网标准，包括其帧格式（目的/源MAC地址、类型字段、数据载荷和CRC校验）以及MAC地址的作用。文章详细阐述了局域网通信原理，对比了传统共享式以太网（CSMA/CD机制）和现代交换式以太网（交换机划分碰撞域）的区别。最后总结了数据链路层与网络层、传输层的分工协作关系：IP协议负责跨网络寻址，TCP协议确保可靠传输，而数据链路层则处理局域网内的帧传输。

谢谢大家的观看!