【Linux】网络层（IP协议）

1. 基本概念

主机：配有IP地址，也要进行路由控制的设备
路由器：即配有IP地址，又能进行路由控制
节点：主机和路由器的统称

2. 理解 IP 协议

2.1 核心作用

核心能力：提供一种能力，把数据报从 A 主机，跨网络，送到 B 主机。
特点：IP 协议是尽力而为的交付，即：有非常大的概率完成传输，但不保证 100% 可靠
解决的问题：主机到主机的通信问题
所以，TCP/IP协议核心就是把数据可靠地，从主机跨网络发送至另一个主机

2.2 IP 地址的构成

IP 地址 = 目标网络 + 目标主机

3. 协议头格式

4位版本号：固定为 4，代表 IPv4 协议
4位首部长度
8位服务类型 TOS：3 位优先权（废弃）+ 4 位 TOS + 1 位保留（恒 0）。4位TOS分别表示：4 项互斥：最小延时、最大吞吐量、最高可靠性、最小成本。这四者相互冲突，只能选择一个。对于SSH/Telnet 选最小延时；FTP 选最大吞吐量
16位总长度：整个 IP 数据报的总字节数
16位 标识 ID
3位标志字段
3位分片偏移（这三个后面分片部分细讲）
8位TTL 生存时间：默认常见64；每过一台路由减 1，减到 0 直接丢弃，防止路由环路
8位协议**：**标识上层承载协议（TCP/UDP/ICMP 等
16位首部校验和CRC 校验，只校验IP 首部，判断首部是否损坏

4. 子段划分(重要)

为什么要划分？

可以类比：学校学院划分，学校划分之后就可以快速定位到某学院某学生，从而大大提高了查找效率。而提前给 IP 地址分组（划分子网），用 "子网号" 做分组标识，就像学校提前划分学院一样

寻找某学生这一过程，类似于路由器"淘汰"过程------ 先淘汰掉所有不匹配的子网，再在目标子网里找主机，淘汰效率越高，转发效率就越高

再看，IP地址=目标网络号+目标主机号，和学号=学院号+学生序号的逻辑一样

通过合理设置主机号和网络号，就可以保证在相互连接的⽹络中，每台主机的IP地址都不相同。但是动管理子网内的IP，是一个相当麻烦的事情

有⼀种技术叫做**DHCP，**能够自动的给子网内新增主机节点分配IP地址，避免了手动管理IP的不便。一般的路由器都带有DHCP功能。因此路由器也可以看做一个DHCP服务器

为了适配不同主机规模的网络，给大型机构、中型企业、小型局域网分配大小不同的地址段，划分 A、B、C、D、E 五类地址

A类0.0.0.0到127.255.255.255
B类128.0.0.0到191.255.255.255
C类192.0.0.0到223.255.255.255
D类224.0.0.0到239.255.255.255
E类240.0.0.0到247.255.255.255

随后，这种方案又出现了局限性：

A 类：单个网络能容纳千万级主机，普通机构根本用不上，出现大量闲置浪费
B 类：一个网段就有 65534 台主机大部分企业实际只用几十、几百台，却照样占一整个 B 类段；大家都抢着申请 B 类，B 类很快枯竭
C 类：网段太小，只有 254 台主机，稍大一点的机构又不够用

针对这种情况提出了新的划分方案，称为CIDR (无类别域间路由)，引入一个额外的子网掩码 (subnet mask) 来区分网络号和主机号

5. 子网掩码

子网掩码也是一个 32 位的正整数。通常用一串 "0" 来结
将 IP 地址和子网掩码进行 "按位与" 操作，得到的结果就是网络号
网络号和主机号的划分与这个 IP 地址是A类、B类还是C类无关

IP地址与子网掩码做与运算可以得到网络号，主机号从全0到全1就是子网的地址范围

IP地址和子网掩码还有一种更简洁的表示方法，例如140.252.20.68/24，表示IP地址为140.252.20.68，子网掩码的高24位是1，也就是255.255.255.0

特殊IP地址

将IP地址中的主机地址全部设为0，就成为了网络号，代表这个局域网
将IP地址中的主机地址全部设为1，就成为了广播地址，用于给同一个链路中相互连接的所有主机发送数据包
127.*的IP地址用于本机环回(loop back)测试，通常是127.0.0.1

IP地址的数量限制

IP 地址 (IPv4) 是一个 4 字节 32 位的正整数。那么一共只有 2 的 32 次方个 IP 地址，大概是 43 亿左右。而 TCP/IP 协议规定，每个主机都需要有一个 IP 地址。这意味着，一共只有 43 亿台主机能接入网络

IP地址存在不够的问题，为了解决；有三种方式：

动态分配 IP 地址：只给接入网络的设备分配 IP 地址。因此同一个 MAC 地址的设备，每次接入互联网中，得到的 IP 地址不一定是相同的
NAT 技术
IPv6：IPv6 并不是 IPv4 的简单升级版。这是互不相干的两个协议，彼此并不兼容；目前还没有普及

6. 私有IP地址和公网IP地址

如果一个组织内部组建局域网，IP 地址只用于局域网内的通信，而不直接连到 Internet 上，理论上使用任意的 IP 地址都可以，但是 RFC 1918 规定了用于组建局域网的私有 IP 地址

10*，前 8 位是网络号，共 16,777,216 个地址
172.16*到 172.31*，前 12 位是网络号，共 1,048,576 个地址
192.168*，前 16 位是网络号，共 65,536 个地址

包含在这个范围中的，都成为私有 IP，其余的则称为全局 IP（或公网 IP）

一个路由器可以配置两个IP地址，一个是 WAN口IP，一个是 LAN口IP (子网 IP)
路由器 LAN 口连接的主机，都从属于当前这个路由器的子网中
不同的路由器，子网IP其实都是一样的 (通常都是 192.168.1.1)。子网内的主机IP地址不能重复。但是子网之间的IP地址就可以重复了
每一个家用路由器，其实又作为运营商路由器的子网中的一个节点。这样的运营商路由器可能会有很多级，最外层的运营商路由器，WAN 口 IP 就是一个公网IP了
子网内的主机需要和外网进行通信时，路由器将IP首部中的IP地址进行替换 (替换成 WAN 口 IP)，这样逐级替换，最终数据包中的 IP 地址成为一个公网IP。这种技术称为NAT(Network Address Translation，网络地址转换)

7. 尝试理解公网

真实的网络拓扑结构非常复杂，即涉及到划分公网IP的组织，ICANN，分配公网 IP 不是简单按国家为单位，还要在全球范围内进行区域划分，如亚太，北美，欧洲等，又要考虑各个国家内部的ISP代理。简单理解公网即可

8. 路由

路由的过程，就是这样一跳一跳 (Hop by Hop)"问路" 的过程

所谓 "一跳" 就是数据链路层中的一个区间。具体在以太网中指从源 MAC 地址到目的 MAC 地址之间的帧传输区间

那么如何判定当前这个数据包该发送到哪里呢？这个就依靠每个节点内部维护一个路由表

路由表可以使⽤route命令查看：

假设某主机上的网络接口配置和路由表如下：

这台主机有两个网络接口，一个网络接口连到 192.168.10.0/24 网络，另一个网络接口连到 192.168.56.0/24 网络

路由表的 Destination 是目的网络地址，Genmask 是子网掩码，Gateway 是下一跳地址，Iface 是发送接口，Flags 中的 U 标志表示此条目有效 (可以禁用某些条目),G 标志表示此条目的下一跳地址是某个路由器的地址，没有 G 标志的条目表示目的网络地址是与本机接口直接相连的网络，不必经路由器转发

转发过程例 1: 如果要发送的数据包的目的地址是 192.168.56.3

跟第一行的子网掩码做与运算得到 192.168.56.0, 与第一行的目的网络地址不符
再跟第二行的子网掩码做与运算得到 192.168.56.0, 正是第二行的目的网络地址，因此从 eth1 接口发送出去
由于 192.168.56.0/24 正是与 eth1 接口直接相连的网络，因此可以直接发到目的主机，不需要经路由器转发

转发过程例 2: 如果要发送的数据包的目的地址是 202.10.1.2

依次和路由表前几项进行对比，发现都不匹配
按缺省路由条目，从 eth0 接口发出去，发往 192.168.10.1 路由器
由 192.168.10.1 路由器根据它的路由表决定下一跳地址

9. 分片

因为数据链路层帧有最大长度限制（MTU），IP 数据包太大装不下，网络层就会将原始的IP数据报分割成多个较小的片段

**16 位标识 (id):**唯一的标识主机发送的报文。如果 IP 报文在数据链路层被分片了，那么每一个片里面的这个 id 都是相同的
**3 位标志字段：**第一位保留 (保留的意思是现在不用，但是还没想好说不定以后要用到)。第二位置为 1 表示禁止分片，这时候如果报文长度超过 MTU，IP 模块就会丢弃报文。第三位表示 "更多分片"，如果分片了的话，最后一个分片置为 0，其他是 1。类似于一个结束标记
**13 位分片偏移 :**是分片相对于原始 IP 报文开始处的偏移。其实就是在表示当前分片在原报文中处在哪个位置。实际偏移的字节数是这个值乘以 8 得到的。因此，除了最后一个报文之外，其他报文的长度必须是 8 的整数倍 (否则报文就不连续了)

判断报文是否分片？

更多分片位为1，1就是分片
更多分片为为0，但片偏移量>0

但是网络通信中，如果过多分片，就会导致丢包概率。减少分片

判断是否把分片收全了？

相同标识的分片，聚合在一起

缺少分片？

第一片缺失：片偏移量为0
中间丢失：按照片偏移量进行升序排序，找到丢失部分（片偏移+自身报文长度=下一片的片偏移量）
最后一片丢失：没有更多分片位是0的分片

减少分片的本质？

在传输层，也就是传输层交给IP层的报文不能过多---->滑动窗口！