13 位片偏移(framegament offset):是分片相对于原始 IP 报文开始处的偏移(确定若干个要拼接的数据包先后顺序)。其实就是在表示当前分片在原报文中处在哪个位置。实际偏移的字节数是这个值 * 8 得到的。因此,除了最后一个报文之外,其他报文的长度必须是 8 的整数倍(否则报文就不连续了)。
8 位生存时间(Time To Live,TTL):数据报到达目的地的最大报文跳数。一般是 64。每次经过一个路由,TTL - 1,一直减到 0 还没到达,那么就丢弃了。这个字段主要是用来防止出现路由循环。
8 位协议:表示上层协议的类型(载荷部分是 TCP 还是 UDP 还是其他的协议)。
16 位首部校验和:使用 CRC 进行校验,来鉴别头部是否损坏。
32 位源 IP 地址和 32 位目的 IP 地址:表示发送端和接收端。为了让我们方便观察,把 32 位的整数通常表示成 "点分十进制"的方式。例如 192.168.2.103。
选项字段(不定长,最多 40 字节):略。
IP 协议数据包的总长度是 64 KB,如果载荷太长,会导致 IP 协议数据包的总长度超过 64 KB,这时 IP 协议数据包会进行拆包发送,在接收端进行组包。 通过 16 位表示 + 3 位标志 + 13 位片偏移这三个属性,实现 IP 协议的拆包组包。
二、IP 地址的数量限制
IP 地址(IPv4)是一个 4 字节 32 位的正整数。那么一共只有 2 的 32 次方个 IP 地址,大概是 43亿左右。而 TCP/IP 协议规定,每个主机都需要有一个 IP 地址。这意味着,一共只有 43 亿台主机能接入网络么?实际上,由于一些特殊的 IP 地址的存在,数量远不足 43 亿。另外 IP 地址并非是按照主机台数来配置的,而是每一个网卡都需要配置一个或多个 IP 地址。
针对 IP 地址不够用,有三种方式来解决:
动态分配 IP 地址: 只给接入网络的设备分配 IP 地址。因此同一个 MAC 地址的设备,每次接入互联网中,得到的 IP 地址不一定是相同的。
NAT 技术: 把 IP 地址,分成两个大类:(1)私网 IP(局域网内部使用)。(2)公网 IP (广域网使用)。此时约定公网 IP 唯一,私网 IP 允许在不同的局域网中重复。 虽然能上网的设备非常多,但是绝大部分都是在局域网中的。
采用 IPv6 协议: IPv6 并不是 IPv4 的简单升级版,这是互不相干的两个协议,彼此并不兼容。IPv6 用 16 字节 128 位来表示一个 IP 地址(数量非常大,足够给世界上每一粒沙子分配一个 IP 地址),但是目前 IPv6 还没有普及。
如果一个组织内部组建局域网,IP 地址只用于局域网内的通信,而不直接连到 Internet 上,理论上使用任意的 IP 地址都可以,但是 RFC 1918 规定了用于组建局域网的私有 IP 地址。
以下为私网 IP 的开头(*表示后续任意),这三个必须要记住。 除了这三个外,其他的基本都是公网 IP(特殊的后续有列出)
10.*
172.16 - 172.31.*
192.168.*
一个路由器可以配置两个 IP 地址,一个是WAN IP,一个是LANIP(子网 IP)。路由器LAN连接的主机,都从属于当前这个路由器的子网中。不同的路由器,子网 IP 其实都是一样的(通常192.168.1.1)。子网内的主机 IP 地址不能重复,但是子网之间的 IP
地址就可以重复了。每一个家用路由器,其实又作为运营商路由器的子网中的一个节点,这样的运营商路由器可能会有很多级,最外层的运营商路由器,WAN IP 就是一个公网 IP 了。子网内的主机需要和外网进行通信时,路由器将 IP 首部中的 IP 地址进行替换(替换成WAN IP),这样逐级替换,最终数据包中的 IP 地址成为一个公网 IP。这种技术称为NAT(Network Address Translation,网络地址转换)。如果希望我们自己实现的服务器程序,能够在公网上被访问到,就需要把程序部署在一台具有外网 IP 的服务器上。这样的服务器可以在阿里云/腾讯云上进行购买。
这里涉及到一个核心问题:引入上述的公网私网 IP,如何进行通信呢?
大体分为 5 种情况:
同一个局域网内部,设备之间通信:可以通信。由于一个局域网内部的设备之间的 IP 是不能重复的,所以可以正常进行通信。
广域网设备和广域网设备之间的通信:可以通信。广域网中的设备 IP 本来就是唯一的,可以正常进行通信。
局域网 1 中的设备 A 尝试访问局域网 2 中的设备 B:这种情况不允许访问。
局域网中的设备主动访问广域网设备:可以通信。这个过程中,NAT 机制就开始发挥作用了。
广域网设备主动访问局域网设备:不允许访问。因为局域网设备 IP 地址不是唯一的。
总结:被动方的 IP 地址不是唯一的就不能进行通信。因此,如果需要进行上述的局域网设备和局域网设备之间的通信,需要搭配广域网中的服务器,进行数据转发。
3.2 内网 IP 设备访问外网 IP 设备的过程(NAT 机制):
下面利用简化版的过程来进行讲解。主机(内网)-> 路由器-> 百度(外网) 。
运营商路由器,可以把它当作一个 NAT 设备,它会对中间经过的数据包,进行网络地址的转化,当内网设备经过运营商路由器访问外网的时候,就会把 IP 数据包中的源 IP,替换成它自己的 IP,端口号也会变(图中没有变)。
到达百度服务器之后,百度就会看到有一个 IP 地址为 5.6.7.8,端口号为 1234 的设备给它发送了一个请求,百度服务器对于我的电脑真实的内网 IP 是一无所知的。
运营商路由器内部维护了一个"映射关系",记录当前这个相应的请求是从哪个内网中的设备发送过来的。
以上就是内网 IP 设备访问外网 IP 设备的过程。如果有多个内网设备同时访问外网,这时运营商路由器给出的 IP 地址是相同的,端口号是不同的。可以利用端口号来进行区分。
通过合理设置主机号和网络号,就可以保证在相互连接的网络中,每台主机的 IP 地址都不相同。那么问题来了,手动管理子网内的 IP,是一个相当麻烦的事情,该如何解决呢?
答:有一种技术叫做DHCP,能够自动的给子网内新增主机节点分配 IP 地址,避免了手动管理 IP 的不便。一般的路由器都带有DHCP功能。因此路由器也可以看做一个DHCP服务器。
过去曾经提出一种划分网络号和主机号的方案,把所有 IP 地址分为五类,如下图所示:
随着 Internet 的飞速发展,这种划分方案的局限性很快显现出来,大多数组织都申请 B 类网络地址,导致 B 类地址很快就分配完了,而 A 类却浪费了大量地址。例如,申请了一个 B 类地址,理论上一个子网内能允许6万5千多个主机。A类地址的子网内的主机数更 多,然而实际网络架设中,不会存在一个子网内有这么多的情况。因此大量的 IP 地址都被浪费掉了。
4.1.2 CIDR | 子网掩码:
针对上面这种情况提出了新的划分方案,称为CIDR(Classless Interdomain Routing):引入一个额外的子网掩码(subnet mask)来区分网络号和主机号。子网掩码也是一个 32 位的正整数。通常用一串0来结尾。将 IP 地址和子网掩码进行按位与操作,得到的结果就是网络号。网络号和主机号的划分与这个 IP 地址是 A 类、B 类还是 C 类无关。