计算机网络基础

前言：

"网，庖牺所结绳以渔。从冂，下象网交文。凡网之属皆从网。" ------《说文解字》（卷七）

一计算机网络概念

1.1 网的概念

在我们的日常生活中，人们对网可能真没那么熟悉，互联网可能你天天都在用，但是却不知道到底是什么；你知道蜘蛛织网，却惧怕蜘蛛，因此也不了了之；至于渔网，那就离你更遥远了，新一代娇生惯养的孩子哪会去捕鱼呢？

网，在古代一般泛指渔网，后来代指纵横交错的对象。

那么，网络为什么会被叫做网络呢？

1.2 计算机网络的概念

网络其实和渔网，蜘蛛网等是一种结构，都是通过连接一个个节点，形成的纵横交错的结构。

这里的节点，指的是一个个计算机。

计算机网络是指将地理位置不同的具有独立功能的多台计算机及其外部设备，通过通信线路和通信设备连接起来，在网络操作系统，网络管理软件及网络通信协议的管理和协调下，实现资源共享和信息传递的计算机系统。

你也可以这样理解

两台或两台以上的计算机通过一定的物理设备连接起来构成了计算机网络。

1.3 计算机网络的作用

通过计算机网络，两台电脑便连接到了一起，他们大概能实现如下功能：

资源共享：凡是入网用户将通过硬件设备，能享受网络中各个计算机系统的全部或部分软件、硬件和数据资源，为最本质的功能，进而每台机器都能进行沟通。

提高可靠性：在某些任务中，网络中的每台计算机都可通过网络相互成为后备机。一旦某台计算机出现故障，它的任务就可由其他的计算机代为完成，这样可以避免在单机情况下，一台计算机发生故障引起整个系统瘫痪的现象，从而提高系统的可靠性。而当网络中的某台计算机负担过重时，网络又可以将新的任务交给较空闲的计算机完成，均衡负载，从而提高了每台计算机的可用性。

提供负载均衡与分布式处理能力：多台计算机也可以同时处理大型任务，将任务分给每个计算机运行，比如说某些大数据计算任务，提高了计算机性能，降低了费用（用多台低性能机器，价格远低于高性能机器）。

集中管理以及综合信息服务：通过网络将多台计算机统一管理，降低管理成本，提高效率。

二计算机网络的发展

2.1 背景

1945 年，二战结束，世界恢复和平，并出现了 美国、苏联 两个超级大国；1947 年，杜鲁门主义 出台，标志着以两个超级大国为代表的冷战正式开始；1957 年，苏联发射了人类第一颗人造地球卫星，令美国大为震惊；1958 年，美国组建高级研究计划局（ARPA），简称阿帕，负责研发用于军事用途的高新科技。

在阿帕中，信息技术处 属于核心机构，主要研究方向是计算机，网络通讯等方面，1968 年，拉里·罗伯茨 提交了一份题为 《资源共享的电脑网络》 报告，报告中提出 让阿帕的计算机相互连接，以达到信息共享的目的，而这就是最早的网络：阿帕网

1969 年 10 月 29 日，进行第一次 阿帕网 的连接实验，起点为 加州大学洛杉矶分校 ，终点则是 500km 之外的 斯坦福研究所 ，第一次连接实验想传输单词 login，最终因连接中断，只成功传输了字母 l 和 o，但这次连接实验成功开启了网络世界的大门；最初 阿帕网 的节点只有四个，到了 1981 年，节点增加至 213 个。

1974 年，温顿·瑟夫 和 罗伯特·卡恩 提出的 TCP/IP****协议 正式发表，TCP/IP****协议 突破了不同硬件间的限制，允许不同的计算机之间进行高效可靠的数据传输，经过数十年的完善，TCP/IP****协议 成为使用最广泛的网络协议，这也为网络快速发展奠定了基础；1986 年，美国国家科学基金会网络 （NSFNET) 成立，阿帕网 只能用于军事研究，而 NSFNET 则是鼓励大学和研究机构加入到自己的互联网中，服务于学术研究，NSFNET 快速发展，并逐渐替代了 阿帕网。

随着互联网在军事和学术领域的不断发展，商业领域对于网络的需求变得越来越迫切，因为这是一个全新的市场，具有不可估量的发展前景；世界上第一家商业互联网服务提供商 The World 很快就成立了，并于 1989 年开始提供互联网的接入服务，目前这家公司的官网仍可访问，随后越来越多的商业互联网服务商开始诞生；1995 年，NSFNET 将自己的经营权转给了美国的私有电信公司，至此互联网正式进入商业时代

尽管商业互联网早在 1989 年就已经开始，但想要通过互联网获取信息仍存在门槛，这对于普通人是很不友好的，导致互联网无法普及；同年，互联网中教父级的人物 蒂姆·伯纳斯-李 发明了 万维网 www，并于第二年开发出了 第一个网页 服务器和 第一个网页浏览器 ，至此，普通人只需要打开浏览器，就能轻松查阅到互联网中的所有信息，信息变得触手可得，互联网也因此快速发展，进入了网页时代。互联网在 1990-2000 年这十年间的发展令所有人吃惊，这期间也诞生了很多互联网传奇

1993 年1 月，马克.安德森 开发了马赛克（Mosaic）浏览器，支持显示图片，并于第二年成立 网景公司 ，推出了新一代 网景浏览器 ，1995 年 网景公司 在纽约上市，一夜之间公司市值就突破了 20 亿美元

1995 年 3 月，斯坦福大学的两名电气工程系的研究生共同创建了 雅虎公司

1995 年 7 月，杰夫·贝索斯 创建 亚马逊，全新的电子商务模式使其创始人一跃成为世界首富

1995 年微软为了回应 网景浏览器 ，推出了经典浏览器 Internet Explorer

1997 年，丁磊在广州创建了 网易公司 ，并推出了强大且免费的 163 邮箱

1998 年 2 月，从美国麻省理工学院毕业回国的 张朝阳 创建了搜狐

1998 年 11 月，马化腾 在深圳创建 腾讯公司，腾讯帝国正式拉开了帷幕

1998 年 12 月，王志东 创建了 新浪网站，才有了后来的新浪微博

1998 年 2 月，谷歌成立，曾想将自己的网络爬虫项目出售给雅虎，惨遭拒绝，多年之后，谷歌成为全球最大的搜索引擎公司

1999 年 9 月，马云带着他的十八罗汉在杭州的公寓中创建了 阿里巴巴集团 ，如今的 淘宝、支付宝 等阿里系产品已经深刻改变了人们的生活方式

2000 年，李彦宏 带着他的 "超链分析" 技术专利创建了百度，"百度一下，你就知道" 的观念深入人心

...

上述内容摘录自知乎文章《可能谦虚的说，这是一篇最全的互联网发展史》

互联网 仍在快速发展，web2.0 和 移动互联网 时代同样诞生了无数传奇，即将到来的 web3.0 也同样令人期待。所有人共建的，就是网络。

2.2 互联网的基本类型

如果按照 网络区域 进行划分，可以分为 独立模式 ，网络互联, 局域网 LAN 和 广域网 WAN。

独立模式：计算机之间相互独立。

网络互联，多台计算机连接在一起，完成数据共享。

局域网 LAN 通常指在一个区域内将多台计算机通过双绞线、同轴电缆，交换机，路由器等连接介质互相连接。

广域网 WAN 则是指将相隔千里的计算机进行连接。

所谓，"广域网"和"局域网"只是一个相对的概念**，并没有明显的界限，比如一个看似很大的广域网，实际也就是个局域网。比如我们有"天朝特色"的广域网，又何尝不是世界的一个大型局域网呢？**

三网络协议

3.1 什么是协议

协议是一种约定，也是一种标准，比如著名的 IEEE 754 标准，就规定了浮点数如何在内存中存储；再比如投资者往往会与被投资者签订一份对赌协议，确保投资顺利进行。

协议制定后，参与者都必须遵守该协议。

不同行业中的协议往往由该行业中的翘楚制定，比如在通信标准领域，华为就担任了重要角色，并作为 5G 标准的主导者之一。

一流企业定标准，二流企业做品牌，三流企业做产品，希望我们国家定下更多标准。

在当前互联网时代，有众多计算机生产商、计算机操作系统和多样化的计算机网络硬件设备。那么，如何实现这些不同设备之间的互相连接呢？

答案是 制定出被大家都认可的协议 ，当协议被制定出来且拥有一定用户基础后，后续厂商推出的硬件设施也必须遵守该协议，否则就会被市场抛弃，如此一来，可以倒逼众多配套设备共同遵守，网络连接环境也就逐渐完善了。

3.2.协议分层

网络在传输过程中面临诸多问题：

数据如何组织传送，得到数据如何解析的问题 -- 数据打包问题
长距离传输， 数据丢失 的问题 -- 数据传输问题
如何在众多主机中定位目标主机的问题 -- 数据定位问题
010101 硬件级别的协议问题 -- 数据接收问题
如何进行数据转发、路径选择的问题 -- 传输路径问题

该如何解决这些问题呢？

这些问题如果整个划到一起，笼统的来看，显然是很难解决的，但是我们仔细观察，可以看出，这几个问题是逐层递进的。

这几个问题是这样的：假设A是发送者，B是接收者

A在组织好自己需要发送的数据后（便引入了数据打包问题）

下一步才开始进行远程运输（引发数据传输问题）

如果在传输途中一切顺利，当你需要寻找到B的位置时（引发数据定位问题）

数据在到达B计算机后，如果是A和B是不同的硬件设备，B计算机是如何接收到A的数据的呢？（数据接收问题）

B接收完后，如何提取到自己需要的信息，如何把各种信息存在对应的文件中？（数据解析和传输路径问题）

这样的话，我们把问题一步步进行分类，逐个击破 -- 高内聚

同时基于 解耦、可维护性、可扩展性 这三点出发，采用 协议分层 的解决方案，即将不同的问题解决策略归入不同模块中，模块之间互不影响 --- 低耦合

这时候，便引入了计算机网络的层状结构，不同分层中包含了各种协议，负责解决不同的问题。

其实分层这个概念早在语言学习阶段就已经接触过了：在学习继承时，子类继承自父类，当前出现了父类和子类这两层结构，父类可以不必关心子类的具体实现，需要时可以直接通过父类指针对子类成员或函数进行访问

在进行分层后，上层无需关心下层的具体实现，只需要使用下层提供的功能和接口即可，分层思想很好的体现了 任何计算机问题都可以通过添加一层软件层解决.

拿日常生活举例，假设 A 想给 B 打电话，只需要拿起手机拨打 B 的号码，等 B 接通电话后，双方便可以通话，在通话过程中， A 和 B 都只有一个任务 -- 说话。

这是因为 A , B 处在语言层，任务就只有一个通话，而不关心通话的具体实现，底层细节啥的都不需要关心，语言层的实现依赖底层细节，但是语言层并不关心这些底层细节,因为没必要。

假设某天 通信设备层 中的电话机坏了，可以将其更换为无线电，继续向 语言层 提供通话的服务，即便设备更换了，A、B 依旧可以正常通话。

不仅 通信设备层 可以更换设备，语言层 也可以更换角色，比如现在变成 B、C 两个外国人进行通话，通信设备层 依旧可以正常提供服务

上述例子中，很好的体现出分层的好处：分层之后，每一层都只关注自己层的功能，使用下层提供的接口，任何一层出问题，都不会直接影响其他层。

因此，分层是解决大量问题的最优解（高内聚、低耦合）

其实，不分层也是可以处理这些问题的，但这对于整个系统的设计都是非常不友好的，你确实可以把所有代码都写在一个文件中，程序是可以运行的，但是如果程序出了问题，或者说对某个功能进行改动，会变得很麻烦。

因为，在近十年左右的编程中，一个程序不同的功能对不同的函数实现，对函数进行整合，于是出现了类，再进一步，一个或多个类形成了一个个模块。每一个模块都对外提供一批接口，在程序中，我们不是通过变量和函数的直接接触来运行程序的，只是通过接口之间的相互交流来运行，类之外的接口不能直接改变类内受保护的一切事物。

因此，程序出现了错误，我们便可以减少因为一小个错误引发的连锁反应，因为我们程序之间每个模块的交流小了，减少了连锁反应，维护同时，引入了封装特性，安全性进一步提高。

但是，假设我们不采用这种高内聚，低耦合思想，那么我们程序的交流就会增加，连锁反应进一步增加，其更改错误就会变得及其麻烦。

在计算机网络这种庞大的结构下，其更改的成本是我们无法想象的，但是，分层之后，无论是进行功能维护，还是进行功能扩展，都可以在不影响其他层的情况下进行

3.3 OSI七层模型

基于网络分层的设计思想，诞生了著名的 OSI 七层网络模型。

OSI（Open System Interconnect），即 开放式系统互连 ，一般都叫 OSI****参考模型 ，是 ISO****组织 在 1985 年研究的 网络互连模型 ，该模型将网络从逻辑上分成了七层，每一层都有对应的协议或 物理设备

OSI参考模型 最大优点是将服务、接口和协议这三个概念明确地区分开来，通过七个层次化的结构模型使不同的系统不同的网络之间实现可靠的通讯

自底向上，OSI参考模型 中不同层级实现功能如下所示：

分层名称	功能
物理层	解决硬件相关的问题，比如 01 序列解析、数字/模拟信号处理、界定连接器和网线的规格

数据链路层	解决两台主机在局域网中如何连通的问题

网络层	解决主机跨网络，经过路径选择后如何到达目标主机的问题

传输层	解决数据传输时可能发生的数据丢失问题，同时通过策略实现数据高效传输

会话层	进行连接管理

表示层	规定信息转换格式

应用层	针对不同应用的协议

OSI参考模型 是一种框架性的设计方法，基于该模型可以实现不同的具体模型，其中最出名的是 TCP/IP五层模型，这也是我们主要学习的网络模型

3.3 TCP/IP五层模型

3.3.1 TCP/IP五层模型的基础

开发人员在使用 OSI七层模型 的过程中，发现这个标准设计的过于麻烦了，应用层、表示层、会话层 可以合为一层：应用层，加上剩下的四层，也就是变成了五层模型.

为什么叫做 TCP/IP 五层模型？

这是因为其中的 TCP、IP 协议非常经典、非常重要，具有代表意义，于是就命名成了 TCP/IP****五层模型

注意： TCP/IP是一组协议的代名词，其中包含了许多协议，共同组成了 TCP/IP 协议簇

TCP/IP 五层模型 也可以称为 TCP/IP 四层模型 ，这是因为 物理层 不是我们开发人员关注的重点。

3.3.1 TCP/IP五层模型的功能

TCP/IP 五层模型 的不同分层功能如下（自底向上）

物理层

负责光电信号的传递方式，以太网 中采用 同轴电缆、双绞线、光纤、电磁波 等传递信号，不同材质决定了信号最大传输速率、传输距离、抗干扰性等，如果信号传递过程中出现衰减，还可以使用 集线器 进行信号增强。

数据链路层

负责设备之间的数据帧的传送和识别，比如网卡设备的驱动、帧同步、冲突检测、差错校验等工作， 数据链路层 中有很多不同的实现标准：以太网、令牌环、无线 LAN 等 ，具体是什么标准，取决于网卡，用于连接多台设备，实现网络数据传输与交换的 交换机 就工作在 数据链路层。

网络层

负责地址管理和路由选择，比如在 IP 协议 中，通过 IP 地址来标识主机，可以通过查询路由表的方式规划出源主机与目标主机之间的传输路线，这正是 路由器 的工作职责

传输层

负责两台主机之间的数据传输，通过诸如 TCP 协议 等传输协议，实现高效、可靠的数据传输，数据传输不一定成功，可以通过重传相关机制重新传输数据。

应用层

负责应用程序间沟通，比如 简单电子邮件传输（SMTP） 、文件传输协议（FTP） 、网络远程访问协议（Telnet） 等，在进行网络编程时，主要针对的就是 应用层。

一般而言，硬件除了工作在某一层外，还需要具备自己下层的功能

对于一台主机，它的操作系统内核实现了从「传输层」到「物理层」的内容
对于一台路由器，它实现了从「网络层」到「物理层」
对于一台交换机，它实现了从「数据链路层」到「物理层」
对于集线器，它只实现了「物理层」

但这并不是绝对的，某些硬件也可以工作在上层，比如 路由器 可以实现传输层的部分功能，交换机 也可以实现网络层的转发。

3.4 系统与网络的联系

操作系统作为计算机的 "大管家" ，网络也是计算机的组成部分，因此，网络模型必然融入操作系统中。

系统、网络不分家，看似设计复杂的网络标准模型其实和系统设计有着千丝万缕的联系，比如 物理层、数据链路层、网络层、传输层 这四层属于 操作系统层 ，剩下的 应用层 属于 用户层，因为我们最终是需要通过操作系统来进行网络通信，所以网络标准模型必然会被融入操作系统中。

应用层中的 应用、表示、会话 不属于系统体系结构，也不能属于系统体系结构，因为他们由用户定义并实现，由于实现方式不固定，也就统称为 应用层 ，网络编程就是在 应用层 中进行的，一般来说，这属于用户使用的软件层。

网络标准模型融入操作系统后，为了让用户能使用网络，操作系统就为网络相关操作提供了一批 系统调用接口 ，也就是后面学习的 socket 套接字编程。

操作系统具有四大管理模块：内存管理 、进程管理、文件管理、驱动管理 ，压根就没有 网络管理，那么操作系统是如何网络进行管理的？

Linux 中一切皆文件 ，网络需要借助网卡通信，而网卡在操作系统看来，不过是一个提供了读方法与写方法的硬件设备而已（是，所以操作系统只需要通过 「文件管理」 那一套来对网络进行管理就行了，因为网卡本身是一个I/O设备）。

其实 socket 本质上就是一个文件描述符，一个专门对于 网络资源（文件） 进行操作的句柄而已，这也就意味着系统提供的网络相关系统调用接口，必然与文件相关接口操作类似
所有主流操作系统都必须实现基于 TPC、IP 实现的核心协议栈（工作在操作系统层中）

四网络传输

4.1 前置概念

4.1.1 处在同一个局域网中的主机，是可以直接通信的

比如部分游戏的本地连接对战功能（CS 1.6 、魔兽世界 、求生之路等），这些游戏在进行本地多人对战时，只需要构建一个局域网，主机相连后即可直接进行通信.

再比如 **QQ面对面快传 **等传输文件的方式，也是通过局域网连接实现的，本质上就是通过热点构建一个子网（局域网），其他手机（主机）连接后，可以直接通信，传输文件

这些日常生活中接触过的操作都在证明处于同一个局域网中的主机是可以直接通信的，其本质原因是，每个主机都有自己的网卡，在主机购买了流量后（也就是互联网中，连接节点的线），可以通过网卡这个硬件设备和网络协议，创建和加入局域网。

4.1.2 协议报头

TCP/IP模型中的不同层都有自己的协议，而协议最直观的表现部分叫做「协议报头」

每一层都有自己的协议很好理解，毕竟每层需要解决的问题都不同，用来解决问题的协议自然就不同。

至于什么是 协议报头 ？协议报头 有什么用？

协议报头 在数据传输过程中，用于承载一些控制信息；协议报头 提供了关于数据包或帧的元信息，以便在网络中正确地路由、传递和处理数据。

比如下面这个就是经典的 TCP 协议报头。

如何理解？

前面提到过，马云创办的淘宝深刻改变了现代人的生活，说白了就是网购，这种网上购物方式必须依赖强大的物流体系，面对成千上万的商品，以及全国大大小小的收货信息，该如何设计快递方式，才能确保物流过程中不会出差错？

答案是通过 快递单 标识物流信息，这里的快递单就好比 协议报头 ，因为有很多家快递公司，每家公司的 快递单 都不一样，不同协议的 协议报头 也不一样，协议报头 是协议最直观的表现部分。

所以假设张三双十一在某东上买了一把青轴机械键盘，商家发货时，会先选择一家 快递公司（协议） 进行发货，将 键盘（有效载荷） 打包，并给包裹贴上一张 快递单（协议报头），准备物流。

在包裹运输的时候，会经过多个站点，包裹在每个站点都会进行分装，以此来发往不同的信息，分装时就依靠读取 快递单（协议报头）信息，确认发往哪个地址（主要是凭借收件人地址）。

如果不发生意外，张三在数天后会收到一条取件信息，张三拿到快递后，首先做的是读取 快递单（协议报头） 信息，确认是自己的包裹后（凭借收件人姓名和手机号确认 ），才会 把包裹拆开（解包） ，最终张三成功拿到了自己网购的 键盘（有效载荷）

此时需要的协议报头不一样，证明每个层次结构需要的协议报头不一样。

在上面这个故事中，张三的整个购物过程可以分为三步：商家打包 -> 物流 -> 张三解包，快递单作为快递公司的代表，包含了很多重要信息，是包裹物流过程中的通关文牒

如果张三想要退货，则会在原先包裹的基础之上，再加一张 快递单2 ，将之前的 快递单1+包裹 整体看作一个 包裹（有效载荷） ，利用新的 快递单2 进行封装。

此时的有效载荷从键盘变成了包裹，证明有效载荷是一个相对的概念

网络中传输的数据可以看作商品，称为 有效载荷 ，传输过程中选择的协议可以看作快递公司，协议报头 自然就是快递单了，实际在进行网络传输时，也是遵循 打包 + 传输 + 解包 这三步走的，只不过在传输过程中还需要再打包，在众多 协议报头 的保驾护航之下，可以确保数据在网络世界中成功递达

快递单1 + 商品 ---> 协议报头 + 有效载荷

快递单2 + （快递单1+商品） ---> 协议报头 + 有效载荷

所以现在可以理解为什么不同层中的协议可以共同完成数据传输工作了，因为对于同层来说，协议是用来解决问题的，问题解决后，会用自己的 协议报头 将数据打包，传给下层；或者把自己本层的协议报头与有效载荷分离后，把有效载荷传给上层

传给下层时：解决完问题后，将上层传过来的有效载荷，与自己层的协议打包后，继续传给下一层，这个过程称为封装
传给上层时：上层得到的是一个自己能看懂的数据包，把自己本层的协议分离后，把有效载荷继续往上传就好了，这个过程称为分用

封装与分用是不同网络层中必须面对的重要问题，只有把这两个问题解决了，整个传输过程才会通畅，关于更多实现细节可以接着往下看。

4.2 同一个局域网通信

有了 局域网内直接通信 和 协议报头 的前置知识后，接下来演示 同一个局域网内两台主机如何通信。

通信过程：

应用层将自己的 协议报头 与用户想发送的信息封装成一个 数据包，传给下一层

传输层将自己的 协议报头 与 数据包 封装成一个新的 数据包 ，传给下一层，不断重复，直到 数据包 传输

到对端主机网络中

链路层从数据包中分离出 有效载荷 ，向上交付，网络层同样需要分离出 有效载荷 ，向上交付，最终 有效载荷 为 主机A 发送的信息，成功交给了 主机B。

解铃还须系铃人，XXX层封装的协议报头，只有同层才能进行解包

得益于 协议分层 ，看似 主机A 与 主机B 在直接通信，实际上数据至少经历了九次传输。

4.3 数据的封装与分用

其实从上面主机通信的例子中，可以产出以下结论：

网络协议每一层都有自己的协议报头
向下传输时，每一层都要有将自己的「协议报头」与「有效载荷」封装，传给下一层的能力
向上传输时，每一层都要有将自己的「协议报头」与「有效载荷」分离，识别并交付给上一层的能力
在逻辑上，同一层中使用的都是同一个协议，都认为自己在于对端直接通信

向上交付时，如何从数据包中将自己的 「协议报头」 与 「有效载荷」 分离呢？

a.「协议报头」中一般都包含了当前报头的大小，用数据包总大小 - 协议报头大小，得到的就是「有效载荷」；除此之外有的「协议报头」与「有效载荷」之间存在特殊分隔符，可以轻松识别并分离

可是协议有很多，在向上交付时，如何知道 「有效载荷」 该传递给哪个协议呢？

b.如果要交给上一层，「有效载荷」中必然包含上一层协议报头，而协议报头中包含了协议信息，自然能知道将「有效载荷」交付给谁了

几乎每层协议都要具备 a、b 两个基本功能，否则就无法向上交付数据。

补充概念

不同的协议层对数据包有不同的称谓,在传输层叫做段，在网络层叫做数据报，在链路层叫做帧。
应用层数据通过协议栈发到网络上时，每层协议都要加上一个数据首部，称为封装。
首部信息中包含了一些类似于首部有多长、载荷有多长、上层协议是什么等信息。
数据封装成帧后发到传输介质上，到达目的主机后每层协议再剥掉相应的首部,，根据首部中的上层「协议报头」将数据交给对应的上层协议处理。

4.4 局域网通信原理

局域网通信的一般原理：在局域网中进行通信时，当一台主机向局域网中发送信息，所有主机都能看到这个信息，但多个主机会选择性的接收这个信息。

局域网中通信的具体实现方式这里不详谈，通过一个例子来辅助理解：

某天，张三正在上课，王老师定了一个规矩：在我上课期间，其他人不允许讨论，如果想发言，需要举手示意

张三听着听着就走神了，突然王老师看着张三想起了一件事，并直接问到：" $张三$ $你的作业为什么没交？$ " ，因为此时全班只有王老师的声音，其他同学听到后发现王老师叫的是 $张三$ ，而不是自己，选择无视了王老师的发言。

而只有张三听到王老师在叫自己名字后，打起精神并站了起来，开始分析王老师传达的信息： $为什么没交作业？$ ，张三想了半天，想出一个理由： $王老师$ $作业我写了，但昨天在家里打怪猎玩的太嗨了，在家里忘带了，下次带给你$ ，其他同学听到张三的发言依旧选择无视，因为与他们无关。

只有王老师收到张三的信息后表示：" $张三，你是不是又玩太刀了$ $你能忘记作业，为什么不能忘记吃饭呢？$ "，全班发出笑声，张三收到信息后尴尬坐下。

故事结束，在上面的故事中，张三所处的环境正是一个 局域网，同学和老师们可以直接通信。

但任何时刻，都只允许对通信有要求的双方进行通信，其它主机能看到局域网中的信息，但是是无法参与双方的通信的。

其中每个人的名字可以看作自己的 标识符 ，王老师发出的信息中只包含了 $张三$ 这个 标识符。

因为在一个教室里，所以除张三外的其他同学也能收到王老师发出的信息，但他们选择无视，因为 $张三$ 这个 标识符 与自己对不上，当张三与王老师在进行对话时，虽然全班人都能听到，但本质上只有张三与王老师在进行通信，而这就是 局域网 中 以太网 的通信原理。

如何理解 "抓包" 行为？

当你收到不是发给你的数据包时，没有选择无视，而是将其收集了起来，这就是抓包。

带入故事中，就是那种喜欢凑热闹的吃瓜群众 网卡默认会过滤掉不属于自己的数据包，可以手动设置成混杂模式，以关闭过滤。

以太是什么东西？为什么能跟网络扯上关系？

以太这个名词源于物理学中的 以太假说 ：认为光在太空中通过以太传播，但物理实验证明其根本不存在，最终沦为物理学界的笑柄。而我们网络中正是通过 光电信号 传输数据的（光电信号中有光），因此就把该标准称为 以太网，用来 "致敬" 物理学。

既然局域网中的数据包可以被所有人收到，也就意味着通信过程可能被干扰，就比如同时向湖面丢石头，产生的波纹之间会相互影响，导致自己的波纹 丢失/混乱。

如果我们不断往局域网中发送大量无用的数据包，会导致 网络碰撞 ，影响局域网中的正常通信，发生 网络碰撞 后，未递达的数据会重新发送，此时再发送就会变得特别慢，因为此时局域网中都是垃圾数据包，大部分时间都用在甄别垃圾数据包上了。

这也就是为什么，当我们在进行某些集体活动，比如说运动会或者是晚上回到宿舍一起打游戏的时候，网络波动会很大的原因，因为他们都在传输数据包，发生网络碰撞的概率大幅提高，从而导致数据递达，也就是网卡。

4.6 远端通信

在学习远端通信之前，需要先认识一下 路由器

路由器 主要工作在 网络层 ，但它也具备 数据链路层 、物理层 的工作能力，并且 路由器 也可以可以看作一台 主机（节点） ，作为远端通信的桥梁，路由器 至少需要级联两个子网，至少要提供两个网络接口。

主机A 与 主机B 不处在同一个局域网中，如果想要进行通信，需要让 路由器 与 主机A 处于同一个子网，同时让 路由器 与 主机B 也处在同一个子网，主机A 把数据交给 路由器 ，路由器 把数据转发给 主机B ，主机A 与 主机B 完成了通信。

也就是说，路由器可以成为两个局域网之间沟通的桥梁，这样一个个局域网构建在一起，成为了广域网。

主机A 正常将信息封装后，向下传递，当数据包来到 网络层 时，如果发现此时有很多主机，自己该如何将数据包正确传递给路由器呢？

五 MAC标识符和 IP 地址

5.1 MAC标识符基础

在网络世界中需要使用 唯一标识符 来标识自己的主机，否则就无法做到信息传递与接收，网卡厂商在生成网卡时，会给每一个网卡都写入属于自己的 SN 号，也就是 MAC 地址，这是一个硬件地址，目前 全球唯一 .

对于 Windows 电脑用户，可以调起 cmd 窗口，输入指令 ipconfig /all 查询自己当前电脑网卡的 MAC 信息

当我们在局域网中进行通信时，可以直接通过 MAC地址比对，判断数据包是不是发给自己的.

但这任然不能解决刚才那个问题，MAC地址只用于局域网内部，因为在局域网内部，每台主机都是互相连接的，但是如果隔着一个路由器呢？我要怎么去寻找接收信息的主机呢？

5.2 IP地址基础

在局域网中，主机可以通过甄别 唯一标识符 MAC 的方式无视不属于自己的信息，此时目标主机并不存在于当前局域网中，按照之前的逻辑，主机A 发送的信息会被所有人丢弃（包括路由器），所以光靠 唯一标识符 MAC 是无法完成跨路由器通信的，还需要一个重要概念：IP 地址

IP 地址 的功能是 标识公网环境下的所有主机 ，当前所谈及的 IP 地址 均为 IPv4 标准，该标准使用了一个 4 字节的无符号整数类型（unsigned int）来表示一个 IP 地址。

cpp 复制代码

// IP地址的结构（通过位段实现）
struct ip
{
    int part1 : 8;
    int part2 : 8;
    int part3 : 8;
    int part4 : 8;
}

操作系统内核由 C语言 编写，而网络中的 传输层 和 网络层 属于操作系统内核，自然也是通过 C语言 实现的

从代码结构中可以看出 IP 地址 由四部分组成，每一部分占 8 字节，表示范围为 [0, 255]。

直接使用二进制表示比较抽象，IP 地址 一般表示为：xxx.xxx.xxx.xxx。

将获取的四个部分转为十进制，然后拼接成字符串即可，关于转换工作不需要我们手动完成，使用系统提供的接口就行了

如何借助 IP 地址 把数据包正确交给路由器？

在路由器中存在一张 路由表 ，其中包含了当前子网中已有路径信息，以及之前通信过的路径信息，主机A 在进行数据包发送前，会先到 路由表 中查询目标路径是否存在，如果存在，就按照路径传递，如果不存在，就会把数据包交给路由器，由路由器完成数据包的转发。

可以把 IP地址 看作学号，规定不同班级的学号前缀不一样，假设张三捡到了一张学生证（数据包），仔细查阅花名册（路由表）后发现不是自己的同班同学，于是将学生证交给了辅导员（路由器），由辅导员来完成学生证的归还工作将数据包丢给路由器的行为称为 默认路由。

现在 主机A 知道自己要把数据包交给路由器，同时也知道 主机B 的 IP 地址，接下来路由器就会收到一个数据包。

路由器拿到数据包后会进行解包，将 以太网报头 拆掉，然后分析 IP 报头 ，规划该数据包的路径，得知需要将此数据包交给 主机B ，加上 令牌环报头（一种协议） 后把数据包丢入令牌环网络中，等待 主机B 截取。

不仅是主机需要解包，路由器等中间设备也需要具备解包能力，因为路径规划依赖于 IP，而查看IP协议报头，需要先将以太网等链路层协议报头去除。

得益于和 路由器 + IP 地址 ，在 网络层 及以上层次中，都认为数据包的内容始终没有改变，而在 网络层 之下，允许各种不同的实现标准进行通信（比如这里的以太网与令牌环），这种优秀的设计使网络在普及时可以畅通无阻

IP 是全球网络的基础。

5.3 MAC标识符和IP地址详解

5.1.1 IP地址

IP地址用来标识网络中不同主机的地址

目前的 IP 地址 有两种：IPv4、IPv6，凡是没有特殊说明的，IP 地址 都是指 IPv4

IPv4 由一个 4****字节的无符号整数 构成，占 32 比特位，可表示的最大地址数为 42亿+

为了让 IP 地址 更便于阅读，可以将整数中的四部分转为十进制后通过符号连接，以 点分十进制 的形式展现，比如 192.168.0.1

IPv4 标准于 1981 年推出，在那个联网设备都还极度匮乏的年代，使用一个无符号整型（最大表示 42 亿+）就足够了，IPv4 在当时看来确实可以标识网络中的主机所有主机，然而谁也没有意料到网络发展如此之快，快到 42 亿个地址根本不够用，IPv4 标准中的所有地址于 2019 年全部分配完毕，这就导致 IPv4 标准现在并不能标识所有主机，只能标识公网环境下的所有主机

为了应对 IPv4 地址不够用的窘境，推出了 IPv6、NAT 等技术，IPv6 足足使用了 16 字节，长度为 128 位，是 IPv4 的四倍，可以标识 340 亿亿亿台设备，是一个天文数字，称可以为全世界的每一粒沙子编上一个地址，目前 IPv6 标准尚未全面普及；而 NAT 技术则是引入了 地址转换 的概念，简言之就是在公网与内网间建立映射关系，使得内网中允许地址重复，NAT 技术提供了一定的安全保护我们普通人使用的网络一般都是内网，地址普遍都是 192.168.xxx.xxx，这种情况下即使你的 IP 暴露，也无法直接定位至你的主机设备

5.3.2 MAC地址

MAC地址用来识别数据链路层中相连的节点

MAC 地址 用一个 6 字节的整数表示，占 48 比特位，可表示的最大地址数为 百万 亿+

MAC 地址 一般用十六进制数字加上冒号的形式来表示，例如: 08:00:27:03:fb:19

MAC 地址 在网卡出厂时就确定了，不能修改. MAC 地址 通常是唯一的（虚拟机中的 MAC 地址 不是真实的 MAC 地址 ，可能会冲突，也有些网卡支持用户配置 MAC 地址)

IP 地址很紧张，MAC 地址就不一样，作为数据包转发的节点，同一个局域网内，MAC 地址重复的可能性几乎为0，48 比特位显得有点浪费，这就好比你每个月要1000生活费，但你爸每个月都给你1000w，足够用，但过于夸张了

5.3.3 IP与MAC的关系

IP 地址 与 MAC 地址 最大的区别在于：传输过程中，IP 地址不会改变，MAC 地址会改变，随着传输距离的增加，MAC 地址改变的次数也会增加

如何理解 IP 地址 与 MAC 地址 的关系？

IP 地址 分为 源IP地址 、目标IP地址 ，MAC 地址 也分为 源MAC地址 、目标MAC地址

假设有一天，张三考上了大学，临近上学日，一向谨慎的张三选择规划好自己的报名路线

因为张三家住贵州，而他的学校在湖北，途径多个省份，张三需要坐高铁从贵州到重庆，再从重庆到湖北，分为两程：贵州->重庆，重庆->湖北，虽然中途涉及换乘，并且每一程的始发地和目的地也不一样，但张三的最终目的地始终没有改变

源IP地址：张三家
目标IP地址：张三考上的学校
源MAC地址： $贵州，重庆$
目标MAC地址： $重庆，湖北$

张三只需要带够钱，并且明确自己的目的地，就一定能抵达

张三的报名之路类似于数据包在网络中的传输之路，IP 地址始终没有改变，但 MAC 地址可能发生改变 ，当 主机A 将数据包交给路由器时，路由器分析 IP 地址得知需要将数据包转交给 主机B ，于是数据包中的 目的 MAC 地址 会变成 MAC-主机B，主机B 收到数据包后，经过不断解包分用，主机B 将会收到 主机A 发送的信息 lo

所以 IP 地址 用来表示始发地与目的地，MAC 地址 用来表示途中需要经过的中转区间，通常把 MAC 地址 的改变称为 下一跳 ，就是从一个子网跳转到另一个子网中

IP 地址 和 MAC 地址 共同协作，确保数据能够从源设备传输到目的设备。IP 地址 提供了端到端的逻辑标识，而 MAC 地址 则在局域网中提供了物理设备之间的唯一标识。这种分层的设计有助于网络的灵活性和可扩展性.

如何在 Linux 中查看 IP****地址 与 MAC****地址？