【Linux】网络层协议 IP

网络层协议 IP

[一. 基本概念](#一. 基本概念)
[二. IP 协议格式](#二. IP 协议格式)
[三. 网段划分 (重点)](#三. 网段划分 (重点))
- [1. 传统方法](#1. 传统方法)
- [2. 子网掩码](#2. 子网掩码)
[四. 特殊 IP 地址](#四. 特殊 IP 地址)
[五. IP 地址的数量限制](#五. IP 地址的数量限制)
[六. 私有 IP 地址和公网 IP 地址](#六. 私有 IP 地址和公网 IP 地址)
[七. 运营商](#七. 运营商)
- [1. 基本网络情况](#1. 基本网络情况)
- [2. 全球网络情况](#2. 全球网络情况)
[八. 路由](#八. 路由)
[九. IP 报文的分片和组装](#九. IP 报文的分片和组装)

网络层：在复杂的网络环境中确定一个合适的路径。

IP 协议：负责在互联网上进行数据包的传输。它提供了无连接的数据报传输服务，但不保证数据包的可靠传输。

无连接：每个数据报独立传输，不维护连接状态。
不可靠：数据报可能会丢失、重复或乱序到达，这些情况需要由上层协议（如TCP）来处理。

一. 基本概念

以通信主机B和C为例，两个主机并不是直接连接的，通信需要解决两个问题：

为什么要交给先一个路由器 F (路径选择的问题)：由网络层 (IP) 解决。
怎么把数据交给路由器 F (局域网通信问题)：同一个局域网可以直接通信，由数据链路层 (MAC地址) 解决。

结论：网络通信的本质：无数个局域网通信，最终实现广域网通信。

IP 地址：全球具有唯一性的 IP (公网 IP)，主要范围两类 IPV4 和 IPV6，用于表示主机的唯一性。

IP 地址= 目标网络 + 目标主机，通过网络号找到对应的子网，通过主机号找到对应的主机。
路由器：配有 IP 地址，能进行路由控制。
主机：配有 IP 地址，也能进行路由控制的设备。
节点：主机和路由器的统称。

数据贯穿整个 TCP/IP 协议栈时，需要添加各自的报头，每一层都需要解决不同的问题：

应用层报头：自身报文完整性，序列化和反序列化的问题。
传输层报头：流量控制、拥塞控制、确认应答、超时重传... 可靠性问题。
网络层报头：路径选择，数据报的转发问题。

重谈 TCP/IP 协议：

IP 的核心作用：将数据包跨网络转发到目标主机，但是可能存在丢包问题 (IP 不关心丢包问题，由 TCP 关心丢包问题)
TCP 的核心作用：进行各种策略，例如：超时重传、流量控制、拥塞控制、确认应答... 保证可靠性！

结论：TCP/IP 协议，提供一种可靠的能力，将数据从 A 主机跨网络，转发给 B 主机！解决的就是主机距离变远进行通信的问题！

二. IP 协议格式

4 位版本号：指定 IP 协议的版本，存在 IPV4 和 IPV6，但是二者不兼容。
4 位首部长度：最大值为 15 bit，单位是 4 字节，IP 头部的最大总长度为 60 字节，由标准报头长度 20 字节，计算得出最大选项长度就是 40 字节。
8 位服务类型：3 位优先权字段(已经弃用)，4 位服务类型字段(TOS)，和 1 位保留字段(必须置为 0)。4 位 TOS 分别表示：最小延时，最大吞吐量，最高可靠性，最小成本。这四者相互冲突，只能选择一个。对于 ssh/telnet 这样的应用程序，最小延时比较重要。对于 ftp 这样的程序，最大吞吐量比较重要。
16 位总长度：IP 数据报字节数，保证数据的完整性。
8 位生存时间：数据报到达目的地的最大报文跳数。一般是 64，每次经过一个路由，TTL -= 1，一直减到 0 还没到达，那么就丢弃了，这个字段主要是用来防止出现路由循环。
8 位协议：表示上层协议的类型 (例如：TCP/UDP)
16 位首部校验和：使用 CRC 进行校验，来鉴别报头是否损坏。
32 位源地址和 32 位目标地址：表示发送端和接收端 IP 地址。
选项：最大 40 字节。
16位标识、3 位标志字段、13 位分片偏移：在 IP 报文的分片和组装详细讲解！

IP 的解包和分用：

IP 是如何做到解包的？通过读取 IP 协议的基本长度 -> 前 20 字节 -> 获取首部长度 -> 选项长度 = 首部长度 - 20 字节 -> 如果存在接着读取，最终完成解包。
IP 是如何做到分用的(交给应用层的哪一个协议)？IP 协议格式存在 8 位协议 (TCP/UDP)，交给上层协议，类似 TCP 协议的端口号。

三. 网段划分 (重点)

网段划分：将一个大的网络划分为多个较小的子网段 (网络)，以便更有效地管理和利用网络资源。这种划分通常基于子网掩码来实现，通过子网掩码可以确定一个 IP 地址属于哪个子网络。

IP 地址 = 网络地址 + 主机地址

网络号：保证相互连接的两个网段具有不同的标识。
主机号：同一网段内，主机之间具有相同的网络号，但是必须有不同的主机号。

子网内的 IP 地址，都是从哪里来的？谁给它的？路由器是家中第一个入网设备，路由器具有构建子网的能力，为连接路由器的主机分配 IP 地址。子网其实就是把网络号相同的主机放到一起。如果在子网中新增一台主机，则这台主机的网络号和这个子网的网络号一致，但是主机号必须不能和子网中的其他主机重复。

发送数据时：先将目的 IP 地址的网络号与源 IP 地址的网络号进行对比，如果相同则在子网内部进行转发，如果不同则将数据报交给路由器进行转发。一个 IP 地址被转发：根据目标网络，先转发报文到目标网络，再将报文在内网中转发。

为什么要进行网段划分？网络通信最终是在公网上进行通信的，进行网段划分，可以淘汰与目的 IP 地址的网络号不同的公网，提高查找效率。报文在进行转发的过程中，在到达目标网络之前，路由只看 IP 地址中的目标网络号，

那么如何进行网段划分？

1. 传统方法

有一种技术叫做 DHCP，能够自动的给子网内新增主机节点分配 IP 地址，避免了手动管理 IP 的不便。一般的路由器都带有 DHCP 功能，因此路由器也可以看做一个 DHCP 服务器。过去曾经提出一种划分网络号和主机号的方案，把所有 IP 地址分为五类，如下图所示：

A 类 0.0.0.0 到 127.255.255.255
B 类 128.0.0.0 到 191.255.255.255
C 类 192.0.0.0 到 223.255.255.255
D 类 224.0.0.0 到 239.255.255.255
E 类 240.0.0.0 到 247.255.255.255

随着 Internet 的飞速发展，这种划分方案的局限性很快显现出来，大多数组织都申请 B 类网络地址，导致 B 类地址很快就分配完了，而 A 类却浪费了大量地址。

例如：申请了一个 B 类地址，理论上一个子网内能允许 6 万 5 千多个主机。A 类地址的子网内的主机数更多。
然而实际网络架设中，不会存在一个子网内有这么多的情况，因此大量的 IP 地址都被浪费掉了。

2. 子网掩码

针对上述情况提出了 "CIDR" 划分方案：引入一个额外的子网掩码 (subnet mask) 来区分网络号和主机号。子网掩码也是一个 32 位的正整数，通常用一串 "0" 来结尾。将 IP 地址和子网掩码进行 "按位与" 操作，得到的结果就是网络号。网络号和主机号的划分与这个 IP 地址是 A 类、B 类还是 C 类无关。

IP 地址和子网掩码还有一种更简洁的表示方法，例如 140.252.20.68/28

IP 地址：140.252.20.68
子网掩码：255.255.255.240（高28位是1，其余是0）
网络号：IP & 子网掩码 = 140.252.20.64（140.252.20.01000000）
子网地址范围：140.252.20.64 ~ 140.252.20.79（140.252.20.01000000 ~ 140.252.20.01111111）

可见 IP 地址与子网掩码做按位与运算可以得到网络号，主机号从全 0 到全 1 就是子网的地址范围。

四. 特殊 IP 地址

将 IP 地址中的主机地址全部设为 0，就成为了网络号，代表这个局域网。
将 IP 地址中的主机地址全部设为 1，就成为了广播地址，用于给同一个链路中相互连接的所有主机发送数据包。
127.*的 IP 地址用于本机环回 (loop back) 测试，通常是 127.0.0.1

五. IP 地址的数量限制

我们知道，IP 地址 (IPv4) 是一个 4 字节 32 位的正整数，那么一共只有 2 的 32 次方个 IP 地址，大概是 43 亿左右，而 TCP/IP 协议规定，每个主机都需要有一个 IP 地址，这意味着，一共只有 43 亿台主机能接入网络么？

实际上，由于一些特殊的 IP 地址的存在，数量远不足 43 亿，另外 IP 地址并非是按照主机台数来配置的，而是每一个网卡都需要配置一个或多个 IP 地址，CIDR 在一定程度上缓解了 IP 地址不够用的问题 (提高了利用率，减少了浪费，但是 IP 地址的绝对上限并没有增加)，仍然不是很够用，这时候有三种方式来解决：

NAT 技术：切分部分公网 IP 地址，用于搭建内网 IP 地址 (地址可以重复)
动态分配 IP 地址：只给接入网络的设备分配 IP 地址，因此同一个 MAC 地址的设备，每次接入互联网中，得到的 IP 地址不一定是相同的。
IPv6：IPv6 并不是 IPv4 的简单升级版，这是互不相干的两个协议，彼此并不兼容，IPv6 用 16 字节 128 位来表示一个 IP 地址，但是目前 IPv6 还没有普及。

六. 私有 IP 地址和公网 IP 地址

如果一个组织内部组建局域网，IP 地址只用于局域网内的通信，而不直接连到 Internet 上，理论上使用任意的 IP 地址都可以，但是 RFC 1918 规定了用于组建局域网的私有 IP 地址。

10.*：前 8 位是网络号，共 16,777,216 个地址。
172.16.*到 172.31. *：前 12 位是网络号，共 1,048,576 个地址。
192.168.*：前 16 位是网络号，共 65,536 个地址。

包含在这个范围中的，都成为私有 IP，其余的则称为公网 IP，私有 IP 是由切分出的一些公网 IP 进行搭建的。

bash 复制代码

Linux: ifconfig
Windows: ipconfig

私有 IP，只能用来组建局域网，不能出现在公网中。
私有 IP，只能在内网中使用，所以不同的子网，IP 地址可以重复。
公网 IP，不能出现重复。
内网、公网，统一采用子网掩码的方式，进行网络建设。

七. 运营商

三大运营商：移动、电信、联通。

路由器：拥有构建子网的能力。

申请 IP，无论是公网 IP，内网 IP，网络建设的工作，都是由运营商做的！

网线 -> 调制解调器 -> 路由器 -> 本地设备 -> 通信

1. 基本网络情况

家用路由器与主机构成一个子网，运营商路由器与家用路由器构成另一个子网。家用路由器的 IP 地址是由更大的路由器分配 (例如：运营商路由器) 的。我们的报文必须经过家用路由器，再经过运营商路由器的转发，才能到达公网中。运营商可以根据你欠费/访问非法的目标地址而拦截你，想要科学上网可以使用代理服务器。

一个路由器可以配置两个 IP 地址，一个是 WAN 口 IP (连接子网/公网)，一个是 LAN 口 IP (连接子网)

路由器 LAN 口连接的主机，都从属于当前这个路由器的子网中。不同的路由器，子网 IP 其实都是一样的 (通常都是 192.168.1.1)，子网内的主机 IP 地址不能重复，但是子网之间的 IP 地址就可以重复了。每一个家用路由器，其实又作为运营商路由器的子网中的一个节点。这样的运营商路由器可能会有很多级，最外层的运营商路由器，WAN 口 IP 就是一个公网 IP 了。

子网内的主机需要和外网进行通信时，路由器将 IP 首部中的 IP 地址进行替换 (替换成 WAN 口 IP)，这样逐级替换，最终数据包中的 IP 地址成为一个公网 IP，防止子网 IP 地址出现在公网上。这种技术称为 NAT (Network Address Translation，网络地址转换)。如何缓解 IP 地址不足的问题？单独切分了部分公网 IP，只用它来搭建内网，这样 IP 地址可以被重复利用了！

如果希望我们自己实现的服务器程序，能够在公网上被访问到，就需要把程序部署在一台具有外网 IP 的服务器上，这样的服务器可以在阿里云/腾讯云上进行购买。

2. 全球网络情况

公网 IP 地址，是以国家、组织、公司为单位，进行申请的。其中将部分公网 IP 地址用于搭建私有 IP 地址。

假设都以国家为单位进行申请，已知全球195个国家，需要为每一个国家分配网络，可以将 IP 地址通过子网掩码：255.0.0.0 将大的网络分配给不同的国家，接着又将大的网络进一步通过子网掩码：255.255.0.0 分配给不同地区，依次进行网段划分！

内网发送报文到公网：如果目标 IP 地址 & 子网掩码 = 目标网络，将报文发送给下一跳路由器的 IP 地址，若遍历所有的路由表条目都不符合时，将报文发送交给默认路由器 (上一层路由器)，直到运营商路由器 (公网)，还存在 NAT 技术。
公网发送报文到内网：数据链路层再讲解。

IP 报文转发过程的本质：就是在进行各个子网间进行转发。

IP 主要解决的核心问题：路径选择 -> 淘汰其它的子网。

两个局域网当中的主机必须通过公网进行通信，先将数据经过公网发送到了服务器，然后再由服务器将数据经过公网转发到了另一个局域网。存在一些技术能够使数据包在发送过程中不进行公网 IP 的替换，而将数据正确送到目标主机，这种技术叫做内网穿透，也叫做NAT穿透。

八. 路由

路由：在复杂的网络结构中，找出一条通往终点的路线。路由的过程，就是这样一跳一跳(Hop by Hop) "问路" 的过程，所谓 "一跳" 就是数据链路层中的一个区间，具体在以太网中指从源 MAC 地址到目的 MAC 地址之间的帧传输区间。

IP 数据包的传输过程也和问路一样：

当 IP 数据包到达路由器时，路由器会先查看目的 IP 地址。
路由器决定这个数据包是能直接发送给目标主机，还是需要发送给下一个路由器。
依次反复，一直到达目标 IP 地址。

那么如何判定当前这个数据包该发送到哪里呢？这个就依靠每个节点内部维护一个路由表！

路由表可以使用 route 命令查看。
如果目的 IP 命中了路由表，就直接转发即可。
路由表中的最后一行，主要由下一跳地址和发送接口两部分组成，当目的地址与路由表中其它行都不匹配时，就按缺省路由条目规定的接口发送到下一跳地址。

假设某主机上的网络接口配置和路由表如下：

这台主机有两个网络接口，一个网络接口连到 192.168.10.0/24 网络，另一个网络接口连到 192.168.56.0/24 网络。
路由表的 Destination 是目的网络地址，Genmask 是子网掩码，Gateway 是下一跳地址，Iface 是发送接口，Flags 中的 U 标志表示此条目有效 (可以禁用某些条目)，G标志表示此条目的下一跳地址是某个路由器的地址，没有 G 标志的条目表示目的网络地址是与本机接口直接相连的网络，不必经路由器转发。

转发过程例 1：如果要发送的数据包的目的地址是 192.168.56.3

跟第一行的子网掩码做 "按位与" 运算得到 192.168.56.0，与第一行的目的网络地址不符。
再跟第二行的子网掩码做 "按位与" 运算得到 192.168.56.0，正是第二行的目的网络地址，因此从 eth1 接口发送出去。
由于 192.168.56.0/24 正是与 eth1 接口直接相连的网络，因此可以直接发到目的主机，不需要经路由器转发。

转发过程例 2：如果要发送的数据包的目的地址是 202.10.1.2

依次和路由表前几项进行对比，发现都不匹配。
按缺省路由条目，也就是默认网关，从 eth0 接口发出去，发往 192.168.10.1 路由器。
由 192.168.10.1 路由器根据它的路由表决定下一跳地址。

路由表可以由网络管理员手动维护(静态路由)，也可以通过一些算法自动生成(动态路由)，路由相关的生成算法：距离向量算法，LS 算法，Dijkstra 算法等。

九. IP 报文的分片和组装

这里的传输层以 TCP 为例，UDP 同理

问题：为什么不把滑动窗口里的数据，大成一个报文，而是分成一个个数据段？这不是增加了发送的次数？
答案：如果传输层报文太长，导致 IP 报文太长，网络层需要将 IP 报文进行分片，因为在数据链路层，单次发送的数据帧的有效载荷长度不能超过 MTU 最大传输单元 (一般是1500)，对方的网络层需要将分片的 IP 报文进行组装，这就导致任意一个分片的 IP 报文丢包，组装的 IP 报文是不完整的，不会将 IP 报文交给传输层，导致增加传输层丢包概率。

IP 分片对传输层是透明的，这意味着传输层无需关心数据是否被分片以及如何重新组装。分片不能作为网络发送的主流，如何进行不分片？传输层不要发送太大的报文。

问题：如果要进行分片和组装，网络层具体该如何做？

16 位标识：唯一的标识主机发送的报文。如果 IP 报文在数据链路层被分片了，那么每一个片里面的这个 id 都是相同的。
3 位标志字段：第一位保留字段 (现在不用)，第二位置为 1 表示禁止分片，这时候如果报文长度超过 MTU，IP 模块就会丢弃报文。第三位表示"更多分片"，如果分片了的话，最后一个分片置为 0，其他是 1，类似于一个结束标记。
13 位分片偏移：相对于原始 IP 报文的有效载荷起始处的偏移量，实际写入的片偏移：偏移量除8 得到的。因为总长度是 16 位的，但是片偏移只有 13 位。

注意：

问题：接收方如何得知自己收到的报文分片了？

答案：3 位标志字段等于000 || 13 位分片偏移等于0

问题：接收方如何得知自己收到的分片收全了？

答案：通过 16 位标识将所有的分片升序排序，起始分片：片偏移必须等于0、中间分片：片偏移等于上一个分片的片偏移+上一个分片报文的长度、结尾分片：3 位标志字必须等于000

问题：接收方如何组合形成完整的报文？

答案：解决了上面两个问题，将分片报文进行升序排序就行了。

下面具体看看 IP 报文大小为 3020 字节的分片过程：

分片和组装的过程不一定在发送方 (MTU = 1500)，也可能存在于路由器 (例如：MTU = 1000)，但是概率比较低，基本不考虑。

在同一个局域网中通信，不需要经过路由器，依赖数据链路层的 MAC 地址进行通信！为什么 MTU = 1500？也是数据链路层决定的！