一、IP协议
在前面,我们学习了应用层和传输层,接下来,我们来学习网络层,网络层的主要功能是在复杂的网络环境中确定一个合适的路由。
1.1 IP协议的基本概念
- 主机:配有IP地址,有可以进行路由控制的设备
- 路由器:配有IP地址,又能进行路由控制
- 节点:主机和路由器的统称
1.2 IP协议头的格式
- 4位版本号:指定IP协议的版本,对于IPv4来说,就是4
- 4位头部长度:IP头部的长度是多少个32bit,也就是4的字节数,4bit表示的最大数字是15,因此IP头部最大的长度是60字节
- 8位服务类型:3位优先权字段(已经弃用),4位TOS字段和1位保留字段(必须置为0),4位TOS分别表示为:最小延时,最大吞吐量,最高可靠性,最小成本,这个四者相互冲突,只能选择一个,对于ssh/telnet这样的应用程序,最小延时比较重要;对于ftp这样的程序,最大吞吐量比较重要
- 16位总长度:IP数据报整体占多少个字节
- 16位标识:唯一的标识主机发送的报文,如果IP报文在数据链路层中被分片了,那么每一个片里面的这个ID都是相同的
- 3位标志字段:第一位保留(保留的意思是现在不同,但是还没想好,说不定在以后就要用到);第二位置为1表示禁止分片,这时候如果报文的长度超过MTU,IP模块就会丢弃报文;第三位表示"更多分片",如果分片的话,最后一个分片置为0,其他都是1,类似于一个结束标记。
- 13位分片偏移:是分片相对于原始IP报文开始处的偏移,其实就是在表示当前分片在源报文中处在哪个位置,实际偏移的字节数是这个值乘以8得到的。因此,除了最后一个报文之外,其他报文的长度必须是8的整数倍(否则报文就不连续了)
- 8位生存时间:数据报达到目的地的最大报文跳数,一般都是64,每次经过一个路由,TTL -= 1,一直减到0还没有到达的话,就可以将其丢弃,这个字段主要是用来防止出现路由循环的
- 8位协议:表示上层协议的类型
- 16位头部校验和:使用CRC进行校验,来鉴别头部是否损坏
- 32位源地址和32位目标地址:表示发送端和接收端
- 选项字段(不定长,最多40字节)
二、网段划分
IP地址分为两个部分:网络号和主机号。
- 网络号:保证相互连接的两个网段具有不同的标识
- 主机号:用一个网段内,主机之间具有相同的网络号,但是必须要有不同的主机号
- 不同的子网其实就是把网络号相同的主机放在一起
- 如果在子网中新增一台主机,则这台主机的网络号和这个子网的网络号一致,但是主机号必须不能和子网中的其他主机重复
通过合理设置主机号和网络号,就可以保证在相互连接的网络中,每台主机的IP地址都不相同。那么问题来了,手动管理子网内的IP是一个相互麻烦的事情。
- 有一种技术叫做DHCP,能够自动的给子网内新增主机节点分配IP地址,避免了手动管理IP的不便。
- 一般的路由器都带有DHCP功能,因此路由器也可以看做一个DHCP服务器。
过去曾经提出一种划分网络号和主机号的方案,把所有IP地址分为五类,如下图所示,
但是这种方式是比较浪费的,因为随着Internet的飞速发展,这种划分方案的局限性很快就显示出来,大多数组织都申请B类网络地址,导致B类地址很快就分配完了,而A类却浪费了大量的地址。
- 例如,申请了一个B类地址, 理论上一个子网内能允许6万5千多台个主机,A类地址的子网内的主机数更多。
- 然而实际的网络架设中,不会存在一个子网内有那么多的情况,因此大量的IP地址都被浪费掉了。
针对这种情况提出了新的划分方案,称为CIDR:
- 引入一个额外的子网掩码来区分网络号和主机号
- 子网掩码也是一个32位的正整数,通常用一串"0"来结尾
- 将IP地址和子网掩码进行按位与操作,得到的结果就是网络号
- 网络号和主机号的划分与这个IP地址是A类、B类还是C类无关
三、特殊的IP地址
- 将IP地址中的主机地址全部设为0,就成为了网络号,代表这个局域网
- 将IP地址中的主机地址全部设为1,就成为了广播地址,用于给同一个链路中相互连接的所有主机发送数据包
- 127.* 的IP地址用于本地环回测试,通常是127.0.0.1,其不走到网络,在IP层直接走到上层交付
3.1 IP地址的数量限制
我们知道,IPv4版本的IP地址是一个字节数为32位的正整数,那么一共有2的32次方个IP地址,大概是43亿左右,但是TCP/IP协议规定每一个主机都要有一个IP地址,这就意味着一共只有43亿台主机能介入网络中吗??
实际上,由于一些特殊的IP地址的存在,数量远不足43亿,另外IP地址并非是按照主机台数来进行配置的,而是每一个网卡中都需要配置一个或者多个IP地址,CIDR(子网掩码)在一定程度上缓解了IP地址不够用的问题(提高了利用率,减少了浪费,但是IP地址的绝对上限数量没有增加),仍然是不够用的,现在有三种方式来解决这个问题:
- 动态分配IP地址:只给接入网络的设备分配IP地址,因此同一个MAC地址的设备,每次接入互联网中,得到的IP地址不一定是相同的。
- NAT技术:后面再说
- IPv6:IPv6并不是IPv4的简单升级版本,他们两个毫不相关,彼此并不兼容,IPv6使用16字节128位来表示一个IP地址,从源头上解决了IPv4数量不同的问题,但是目前IPv6还没有普及。
3.2 私有IP地址和公有IP地址
如果一个组织内组建局域网,IP地址只用于局域网内的通信,而不直接连到Internet上,理论上,使用任意的IP地址都可以,但是RFC1918中规定了用于组建局域网的私有IP地址。
3.2.1 私有IP地址的范围
私有IP地址的范围:(包含在这个范围中的地址都称为私有IP地址,其余的全部称为全局IP地址或者公网IP地址)
- 10.* :前8位是网络号,一共有16777216个地址
- 172.16. * 到 172.31. * :前12位是网络号,一共有1048576个地址
- 192.168. *:前16位是网络号,一共有65536个地址
3.2.2 结合私有IP地址和公有IP地址
我们来回顾一下之前的知识点:IP地址是给目标服务器提供最终的地址,主机定位和路由;IP地址等于目标网络 + 目标主机;网络是被运营商精心设计的;网段划分:分类划分法和子网掩码;为什么要进行网络划分,目的是为了给出子网地址,进行路由查找的功能,先查找子网,再查找目标主机。
运营商的工作是非常重要的。
- 一个路由器中可以配置多个IP地址(至少两个以上),一个是WAN口IP,连接外部地址,一个是LAN口IP;我们在进行路由器的消息转发的时候,由于内网IP不能出现公网中,我们的报文在路由器中进行转发的时候,需要使用WAN口IP来替换报文中的源IP地址。
- 路由器的LAN口连接的主机都从属于当前这个路由器的子网中
- 不同的路由器中,子网IP地址其实都是一样的(通常都是192.168.1.1),子网内的主机IP地址不能重复,但是子网之间的IP地址就可以进行重复
- 每一个家用路由器,其实又作为了运营商路由器的子网的一个节点,这样的运营商路由器可能会有很多级,最外层的运营商路由器的WAN口IP就是一个公网IP
- 子网内的主机需要和外网进行通信时,路由器将IP首部中的IP地址进行替换(替换成为WAN口IP地址),这样进行逐级替换,最终数据报中的IP地址成为一个公网IP地址,这种技术就称为NAT(网络地址转换)
- 如果希望我们自己实现的服务器程序能够在公网上被访问,就需要把程序部署到一条具有外网IP地址的服务器上,这样的服务器可以在阿里云/腾讯云上进行购买
3.3 路由
基本概念:在复杂的网络结构中,找出一条通往终点的路线。
例子一:
我们可以来举个例子,在最近《黑神话-悟空》比较火热,拿唐僧去西天取西经,唐僧在去往西天的途中,会经过不同的地方,每到一个地方都需要询问去西天怎么走,他的这个路由就是一跳一跳的问路的过程,所谓的这一跳就是数据链路层中的一个区间,具体在以太网中指的是从源MAC地址到目的MAC地址之间的帧传输区间。
但是这里我们还没有学习MAC帧的概念,这里需要注意的是在数据链路层中每经过一个区间,我们都需要将源MAC地址和目的MAC地址进行改变。要区别IP和MAC帧
IP数据报的传输过程和这个问路相似:
- 当IP数据报到达路由器时,路由器会先查看目的IP
- 路由器决定将这个数据报是能直接发送给目标主机的,还是需要发送给下一个路由器
- 依次反复,一直到达目标IP地址
那么如何判断当前这个数据报应该发送到哪里呢??这个就依靠每一个节点内部维护一个路由表
例子二:
- 路由表可以使用route命令查看
- 如果目的IP命中了路由表,就直接转发即可
- 路由表中的最后一行,主要由下一跳地址和发送接口两个部分组成,当目的地址与路由表中其他行都不匹配时,就按路由条目规定的接口发送到下一跳地址。
假设某主机上的网络接口配置和路由表如下:
四、报文分片
4.1 在接收方的角度来看待分片
我们在网络中会收到大量的IP报文,多个客户端发送的IP报文,有的报文分片了,有的报文没有分片。
4.1.1 如何确定该报文是否分片
报文没有进行分片:
我们可以根据报文中的标志位来判断该报文是否分片了,更多分片 == 0 并且 片偏移 == 0
报文进行分片:
当报文进行分片的话,报文一共有三种情况:第一片,中间片,最后一片。每一个报文分片都有一个标识,该标识是一样的。
- 第一片:更多分片 == 1 并且 片偏移 == 0
- 中间片:更多分片 == 1 并且 片偏移 != 0
- 最后一片:更多分片 == 0 并且 片偏移 != 0
4.1.2 保证收到所有的分片
我们可以根据片偏移来进行组装分片,因为片偏移是升序排序的。
4.1.3 分片进行组装交付
4.2 在发送方的角度来看待分片
我们在进行分片的时候,不能简简单单地直接将报文直接进行分片,因为IP报文即使进行了分片,这个IP报文还是IP报文,所以这个IP报文还是要带上其报头。在进行计算分片报文的大小还是要加上报文的大小。