008-网络层 - 技术栈

网络层

网络层的作用就是在网络环境中确定一个合适的路径。

1. IP协议

1.1 初识IP

IP的作用/意义：IP地址提供了一种"能力"，将数据从B主机跨网络可靠送至C主机的能力（网络层提供能力，传输层提供策略，网络层大概率可以从B传输到C，但也有小概率丢包，如果丢包，由上层的策略进行处理，如：超时重传，网络层不再考虑可靠的问题）。

1.2 基本概念

主机：配有IP地址，但是不进行路由控制的设备。

路由器：配有IP地址，又能进行路由控制。

节点：主机和路由器的统称。

1.3 IPv4协议头格式

4位版本号（version）：指定IP协议的版本，对于IPv4来说就是4
4位头部长度（header length）：表示头部有多少个4字节的长度，即范围为 $0, 60$ ，如果是20，意味着没有选项，如果超过20，以为着有选项。
8位服务类型（Type Of Service）：3位优先权字段（已经弃用），4位TOS字段，和1位保留字段（必须置为0），4 位 TOS 分别表示：最小延时、最大吞吐量、最高可靠性、最小成本，这四者相互冲突，只能选择一个，对于 ssh/telnet 这样的应用程序，最小延时比较重要，对于 ftp 这样的程序，最大吞吐量比较重要。
16位总长度（total length）：IP数据占多少字节。
16位标识（Identification）：唯一标识的主机发送的报文，如果IP报文在数据链路层被分片了，每一个片里的这个id都是相同的，用于分片重组。
3位标志字段（Flags）：第一位保留，第二位置为 1 表示禁止分片，这时候如果报文长度超过 MTU，IP 模块就会丢弃报文，第三位表示"更多分片"，如果分片了的话，最后一个分片置为 0，其他置为1，类似于一个结束标记。
13位分片偏移（ramegament offset）：是分片相对于原始IP报文开始处的偏移，实际就是在表示当前分片在原报文中处在哪个位置，实际偏移的字节数是这个值*8，因此，处理最后一个报文外，其他报文长度必须是8的整数倍。
8位生存时间（Time To Live, TTL）：数据报到达目的地的最大报文跳数，一般是64，每经过一个路由，TTL-1，如果减到0还没到达，就被丢弃了，主要用用防止路由循环。
8位协议（Protocol）：表示上层的协议类型，如TCP、UDP。
16位头部校验和（Header Checksum）：使用CRC进行校验，来鉴别头部是否损坏。
32位源地址和32位目的地址（Source Address，Destination Address）：表示发送端和接收端。
选项字段（Options）：不定长，最多40字节。

通过源IP、源端口、目的IP、目的端口、协议这五元组，就可以标识一个网络连接。

1.4 网段划分

IP地址是32位组成的，这意味着所有的IP地址加起来只有2322^{32}232个。这意味着IP地址是有用且有限的资源，对于这样的资源，我们需要通过合理的划分来分配给不同的区域，如：组织、学校等。网段划分就是用来划分IP的规则。

IP地址分为两个部分，网络号和主机号。

网络号：保证相互连接的两个网段具有不同的标识。
主机号：同一网段内，主机之间具有相同的网络号，但是必须有不同的主机号。

不同的子网其实就是把网络号相同的主机放到一起。
如果在子网中新增一台主机，则这台主机的网络号和这个给子网的网络号一致，但是主机号不能和子网中的其他主机重复。

通过合理设置主机号和网络号，就可以保证在相互连接的网络中，每台主机的IP地址都不相同。

手动管理子网IP是一个相当麻烦的事情，DHCP就是解决这个问题的。

DHCP技术能够给子网内新增的主机节点分配IP地址，避免手动管理IP的不便。
一般的路由器都带有DHCP功能，因此路由器也可以看作一个DHCP服务器。

过去曾经提出一种划分网络号和主机号的方案，把所有IP地址分为五类，如下图所示：

A类：0.0.0.0到127.255.255.255
B类：128.0.0.0到191.255.255.255
C类：192.0.0.0到223.255.255.255
D类：224.0.0.0到239.255.255.255
E类：240.0.0.0到247.255.255.255

随着Internet的飞速发展，这种划分方案的局限性很快显现出来，大多数组织都申请B类网络地址，导致B类地址很快就用完了，而A类地址中有大量的主机地址没有被使用，造成了大量的浪费。

例如：申请了一个B类地址，理论上一个子网内允许6万5千多个主机，A类的主机更多。
然而实际网络架设中，不会存在一个子网有这么多的情况，因此大量的IP地址都被浪费了。

针对上面的情况，提出了新的划分方案，称为CIDR（Classless Interdomain Routing）：

引入一个额外的子网掩码（subnet mask）来区分网络号和主机号
子网掩码也是一个32位的正整数，通常用一段"1"开头，一段"0"来结尾
将IP地址和子网掩码进行"按位与"操作，得到的结果
网络号和主机号的划分与这个IP地址是A、B、C类无关。

可见，IP地址和子网掩码进行与运算可以得到网络号，主机号从全0到全1就是子网的地址范围。

IP地址和子网掩码还有一种更简洁的表示方法，例如140.252.20.68/24，表示IP地址为140.252.20.68，子网掩码的高24位为1，即255.255.255.0。

那么为什么要进行网段划分？为了支持高效的路径查找，大大提高查找目标主机的效率，如果没有网段划分，我们就只能在网络世界中，在所有的主机里面找到我们的目标主机，这样的效率是非常低下的，但是有了网段划分，我们拿到目标主机后，先看网络号，如果网络号和当前网络号相同，说明该主机就在我们的网段中，直接发给他就行，如果网络号和当前网段的网络号不同，那么就由路由器找到对应的网段，发给对应网段的路由器，让该路由器转发给对应主机，这样就提高了效率。

1.5 特殊的IP地址

IP地址中的主机地址设为全0，就成为了网络号，代表这个局域网。
IP地址为全1，就成为了广播地址，用于给同一个链路中相互连接的所有主机发送数据包。
127.*的IP地址用于本机环回（loop back）测试，通常是127.0.0.1。

1.6 IP地址的数量限制

IPv4的地址一共只有2322^{32}232个，大概是43亿左右，而TCP/IP协议规定，每个主机都要有一个IP地址。

这意味着一共只有43亿主机能接入网络？

实际上，由于一些特殊IP地址的存在，IP地址的数量远不足43亿，另外IP地址并非按照主机台数来配置的，而是每个网卡都需要一个或多个IP。

CIDR在一定程度上缓解了IP地址不够用的问题（提高了效率、减少了浪费，但IP地址的绝对上限并没有增加）仍然不是很够用，这时有三种方式来解决：

动态分配IP地址：只给接入网络的设备分配IP地址，因此同一个MAC地址的设备，每次接入互联网时，得到的IP地址不一定相同。
NAT技术（后面会详细介绍）。
IPv6：IPv6并不是IPv4的简单升级版，这时互不相干的两个协议，彼此并不兼容，IPv6用16字节128位来表示一个IP地址，但是目前尚未普及。

1.7 私有IP地址和公有IP地址

如果一个组织内部组建局域网，IP 地址只用于局域网内的通信，而不直接连到 Internet 上，理论上使用任意的 IP 地址都可以，但是 RFC 1918 规定了用于组建局域网的私有 IP 地址：

10.*：前八位时网络号，共16777216个地址
172.16.*到172.31.*：前12位是网络号，共1048576个地址
192.168.*：前16位是网络号，共65536个地址

在上面这个范围内的都是私有IP，其余的都是全局IP（公网IP）

一个路由器可以配置两个 IP 地址，一个是 WAN 口 IP，一个是 LAN 口 IP（子网IP）
路由器 LAN 口连接的主机，都从属于当前这个路由器的子网中
不同的路由器，子网 IP 其实都是一样的（通常都是 192.168.1.1），子网内的主机 IP 地址不能重复，但是不同子网之间的 IP 地址就可以重复了。
每一个家用路由器，其实又作为运营商路由器的子网中的一个节点，这样的运营商路由器可能会有很多级，最外层的运营商路由器，WAN 口 IP 就是一个公网 IP 了。
子网内的主机需要和外网进行通信时，路由器将 IP 首部中的 IP 地址进行替换（替换成 WAN 口 IP），这样逐级替换，最终数据包中的 IP 地址成为一个公网 IP，这种技术称为 NAT（Network Address Translation，网络地址转换）。
如果希望我们自己实现的服务器程序，能够在公网上被访问到，就需要把程序部署在一台具有外网 IP 的服务器上，这样的服务器可以在阿里云/腾讯云等处进行购买。

我们所有人通过自己的设备上网，都是在私网里的，然后通过上面的结构来接入公网，而这种结构的组建是通过运营商来完成的，而我们就是接入到了这些运营商组建好的网络。

1.8 路由

路由就是在复杂的网络结构中，找到一条通往终点的路线。

所谓"一跳"就是数据链路层中的一个区间，具体在以太网中指从源 MAC 地址到目的MAC 地址之间的帧传输区间。

IP 数据包的传输过程也和问路一样。

当IP数据包到达路由器后，路由器会先查看目的IP
路由器决定这个数据包时能直接发送给目标主机还是需要发送给下一个路由器
依次反复，一直到达目标IP地址

那么如何判定这个数据包该发送到哪里，这就依靠每个节点内部维护一张路由表。

路由表可以通过route命令查看
如果IP命中了路由表，就直接转发
路由表的最后一行，主要有下一跳地址和发送接口两部分组成，当目的地址与路由表中其他行都不匹配时，就按缺省路由条目规定的接口发送到下一跳地址。

假设某主机上的网络接口配置和路由表如下：

这台主机有两个网络接口，一个连到192.168.10.0/24，另一个网络接口连接到192.168.56.0/24网络。
路由表的 Destination 是目的网络地址，Genmask 是子网掩码，Gateway 是下一跳地址，Iface 是发送接口，Flags 中的 U 标志表示此条目有效（可以禁用某些条目），G 标志表示此条目的下一跳地址是某个路由器的地址，没有 G 标志的条目表示目的网络地址是与本机接口直接相连的网络，不必经路由器转发。