计算机网络(十) —— IP协议详解,理解运营商和全球网络

目录

一,关于IP

[1.1 什么是IP协议](#1.1 什么是IP协议)

[1.2 前置认识](#1.2 前置认识)

二,IP报头字段详解

三,网段划分

[3.1 IP地址的构成](#3.1 IP地址的构成)

[3.2 网段划分](#3.2 网段划分)

[3.3 子网划分](#3.3 子网划分)

[3.4 IP地址不足问题](#3.4 IP地址不足问题)

四,公网IP和私有IP

五,理解运营商和全球网络

六,路由

七,IP报文的分片与组装


一,关于IP

1.1 什么是IP协议

场景:我数学成绩很好,10次考试6次满分,然后大家都在传,说我有"数学考满分的能力",那么我一定能做到吗? --> 不一定,只是有很大的概率考满分

问题:如何保证我每次都考满分?

解答

  • 我有很大的概率考满分,如果没考满分,就重新考
  • 这样就能保证每次都考满分。老师是给我安排考试的人(提供策略),我是真正"执行考试"的人,没考到满分就重新考,这相当于超时重传
  • 然后老师提供策略,就相当于Tcp,所以Tcp在网络中更多的是:"提供可靠性策略",真正去考试的是"我",我就是 --> IP协议。

IP协议的本质工作:提供一种能力,将数据从A主机跨网络送到B主机。

用户需要的是:提供一种能力,将数据"可靠地 "将数据从A主机跨网络送到B主机;按照现在的网络,将数据成功送过去的概率很高,但不是100%,所以传输层提供策略,下层提供能力,两者结合就能保证"我"每次都能考满分。

1.2 前置认识

数据发送的过程中会经过很多路由器,就好比我们网络基础1的旅游的例子

  1. 要对所有的主机进行标识,用源ip和目的ip来标识源主机和目的主机;IP分为私有IP和共有IP
  2. 旅游的例子,我们要先去故宫,得先去北京:"去目标城市,去目标地点";唐僧要去西天的大雷音寺,拜见佛祖求取真经:"西天就是目标城市,大雷音寺就是目标地点,但是到了目标地点还不够,还得通过端口找到佛祖这个进程,然后交数据"

IP地址 = 目标网络 + 目标主机

任何一个主机都是在某个子网上的,由这个子网的路由器连接,发送数据后要先到达主机B所在的的子网网络(先到达目标网络),然后想办法将报文交给主机B(交给目标主机) --> 依据:路由器的转发机制。(会跨越很多子网)

我们处在一个精心设计的世界中,你有身份证号,上学时有学号,上班时有工号,但是我们学号不是单纯的数据,是有格式的:学号 = 年纪编号 + 学院编号 + 专业编号 + 班级编号 + 学号03

场景

  • 我捡到一个校园卡,只有学号432008,大部分人不知道这个学号上对应的学院编号是多少,我只知道这是个学号,但这肯定是其它学院学生的,因为这个学号开头和我不一样!
  • 然后我每个学院都去问一遍,这个归还校园卡的过程本质是"查找",查找的本质就是"排除",一个一个学院去问效率太低。
  • 那么每个学院都有学生会主席,每个学生会主席都给自家学院建了一个群,然后每个主席又相互建了一个主席群,而且学生会主席肯定知道其它学院的编号,然后我艾特主席,把卡照片发给他,然后主席再把照片发主席群里去
  • 然后主席艾特了以下电气学院的主席,然后电气主席说这是我们学院的学号,然后电气主席再把照片发到他的电气学院群里去艾特小美,然后交换联系方式,最后物归原主

上面一顿操作下来,让整个校园卡归还过程快速合理,一开始我说不是我学院的,排除了我这个学院的所有人,然后主席找到了电气主席本质是排除了其它学院,就加速了归还过程。

查找的本质是"排除" ,所以建立群的方式,是提升了淘汰的效率,以前一次淘汰一个人,现在是淘汰一群人

我们把我自己的学院编号叫做源IP地址,把要归还的校园卡的学校叫做目的IP,我的群叫做局域网主机,把主席叫做局域网出口路由器,把主席群叫做公网,像这样一个一个群,就能提高效率,因为一次可以排除很多东西

IP协议意义:构建网络的时候,为我们将来定位一台主机,提供基础保证。

二,IP报头字段详解

两个老问题:

  • 报头和有效载荷如何分离?
  • 如何将有效载荷交付给上层?
    ①4位首部长度
  • 真实报头长度 = 4位首部长度(假设是x) * 4,范围为[0000, 1111],换成十进制就是[0, 15]
  • 标准报头长度为20字节,那么x就是5,首部长度就是[5, 15],就是[20, 60]字节之间,这和Tcp是一模一样的

②16位总长度

  • 代表报文总长度,所以报文长度 = 固定长度报头 + 自描述字段,
  • 有效载荷长度 = 总长度 - 固定长度报头,就能将有效载荷和报头分离

③4位版本

  • 这个是固定死的,对于IPv4来说就是4
  • 但是现在有个问题,ip地址是32位,也就是42亿个,现在入网设备太多了,面临着"IP地址不足"的问题
  • 解决方法有很多,NAT,还有IPv6,其中IPv6相当于新的协议了,它用128位来标识,IPv6和IPv4不兼容,IPv6我国最强大,主要用在国内内网,IPv4主要用在公网,这个我们后面讲运营商在讲,现在默认认为是4

④8位服务类型

  • 丢包问题是无法解决的,这4个选项是为了在进行数据包转发时,给路由器提供转发依据的,提高可靠性,了解一下即可
  • 3位优先权字段(已经弃用),4位TOS字段, 和1位保留字段(必须置为0)。4位 TOS分别表示:最小延时,最大吞吐量,最高可靠性,最小成本。这四者相互冲突,只能选择一个。对于 ssh/telnet这样的应用程序,最小延时比较重要;对于ftp这样的程序,最大吞吐量比较重要

⑤8位生存时间(TTL)

  • 数据每经过一个路由器就是一次转发,但是网络太大了可能出bug,而且接收方可能会挂掉无法接收数据,那么IP报文会被无限转发,这种报文称为流离报文
  • 所以我们给每个报文设置一个生存时间,表示该报文在转发的时候能经过的路由器的跳数,每经过一个路由器,生存时间就 -=1,如果为0时,路由器直接丢弃报文

⑥8位协议

  • 指的就是我们要把IP的有效载荷交付给上层的哪一个协议
  • 下层分离报头和有效载荷后,根据8位协议将有效载荷交付给上层的指定协议

⑦32位源IP和32位目的IP

  • 我们以前在进行socket套接字编码的时候,要求填充 ip + port,现在可以认为:我们在应用层要把点分十进制的ip字符串转化成4字节的ip是为了填充报头的这两个内容的,而32位源IP和32位目的IP是提供给路由器让它进行路径选择的
  • Tcp只存在操作系统上,在各路由器中是没有Tcp层的
  • 只有通信双方主机具有Tcp层,因为所有路由器只工作在网络层。(路由器可能有Tcp,但是不用)

⑧16位标识,3位标志和13位片偏移后面讲

三,网段划分

3.1 IP地址的构成

IP地址分为两部分:网络号和主机号

  • 网络号:保证相互连接的两个网段具有不同的标识
  • 主机号:同一段网络内,主机之间具有相同的网络号,但是必须具有不同的主机号

这就好比我们学号的班级加个人编号一样,一个班级内的同学前面的数字是一样的,这叫做同一个网段,后面两个数字或者三个数字不一样,这就是主机号不能相同

  • 路由器本质也是一个特定子网的主机,所以路由器它自己也要配置IP地址和主机号
  • 路由器实现转发,那么路由器要连接至少两个局域网/子网,所以路由器也一定要配置多个IP地址和主机号 --> 原因:路由器有多张网卡
  • 路由器一般是一个子网中的第一台设备,它的IP地址一般都是"网络号.1"
  • 路由器的核心功能是IP报文的转发,但是路由器的功能不仅仅如此,比如构建局域网/子网,子网中的主机的IP就是路由器分配的,这个后面公网IP和私有IP再将讲
  • 内网IP:如果在子网中新增一台主机, 则这台主机的网络号和这个子网的网络号一致, 但是主机号必须不能和子网中的其他主机重复;并且路由器里面也有操作系统的,所以路由器会对子网IP做管理(DHCP协议)

DHCP协议:全称 Dynamic Host Configuration Protocol,动态主机配置协议

  • DHCP通常用于大型网络环境中,主要工作就是集中地址管理,分配IP地址,使网络中的主机动态获得IP地址,Gateway地址,DNS服务器地址等信息,能够提升地址的使用效率
  • DHCP是基于UDP的,一般的路由器都有DHCP,所以路由器也可以看作是DHCP服务器
  • 我们连接校园网或者WiFi时,都会要求输入密码,这其实就是路由器在验证你的身份,验证通过后,路由器就会给你动态分配一个IP地址,然后我们就可以进行各种上网动作了

3.2 网段划分

故事:网络开始兴起的时候是32位的IP,可以标识2^32差不多42亿,用完就没了,所以我们可以认为IP地址是一种有限的资源,就意味着各个国家是要竞争IP的

IP分为网路地址和主机地址,曾经提出的划分这两个地址的方式,是把IP地址分为5类,称之为分类划分法:

各IP地址的取值范围如下:

  • A类:0.0.0.0 到 127.255.255.255
  • B类:128.0.0.0 到 191.255.255.255
  • C类:192.0.0.0 到 223.255.255.255
  • D类:224.0.0.0 到 239.255.255.255
  • E类: 240.0.0.0 到 247.255.255.255

但是随着网络发展,这种划分方式问题很快出现:

  • 大多数组织都申请的B类网络地址,导致B类网络地址很快就被分完了
  • 所以A类浪费了大量的地址,而且每一个子网中的主机号也很难全部用完,例如,申请一个B类地址,理论上一个B类子网能构建6万5千多个主机IP,A类的更多,但是实际上一个子网不会有这么多主机,因此大量的IP被浪费掉了
  • 所以网络的研究员针对性地提出了一种划分方案:CIDR

3.3 子网划分

注意:该方法是针对上面五种IP的类类型提出的,因为可以看到有些IP地主机号太多了,实际情况下不需要这么多主机,所以需要将主机号减少,减少IP的主机数,就能划分出更多子网,减少IP地址浪费

CIDR,全称Classless Interdomain Routing:

  • 在分类划分法的基础之上,引入一个额外的子网掩码,来区分网络号和主机号,这个掩码也是一个32位正整数,用"0"和"1"表示,通常用一串"0"来结尾
  • 将IP地址和当前网络地子网掩码进行"按位与",得到的结果就是当前所在网络的网络号

有了CIDR之后,一个网络就被更细粒度地划分成了一个个更小地子网,这样IP地主机号就越来越小,就可以减少IP地址被大量浪费,下面是具体步骤:

  • 比如在某个子网中,将IP地2前24位作为网络号,那么该网络地子网掩码地32个比特位中前24位就是1,后面8位就是0,每8位以点隔开,最后就是255.255.255.0
  • 假设子网中有一台主机192.128.128.0,那么将这个IP与掩码进行"按位与(&)"计算后,就是192.168.128.0,就是这个子网对应地网络号
  • 子网掩码,可以对32位IP进行任意划分,为了书写方便,我们一般把子网掩码这样表示:192.168.128.0 /24,"/24" 表示整个IP地址当中前24个比特位位1,后面8个为0

特殊的IP地址

有些IP具有特殊用途,不能作为主机地IP地址:

  • IP地主机地址为0,就是网络号,代表这个局域网
  • 将主机号设为1,就成为了"广播地址",用于给一个链路中相互连接地所有主机发送数据包
  • 127.*地IP地址通常用于本机环回测试,通常是127.0.0.1

3.4 IP地址不足问题

CIDR虽然一定程度上缓解了IP地址浪费的问题,但是没有增加IP地址的绝对上限,仍然不是很够用,所以有下面三种解决方法:

  • 动态地址分配:只给接入网络的设备分配IP地址,因此同一个MAC地址的设备,每次接入互联网中,得到的IP地址不一定是相同的,简单来说就是路由器发放和回收IP,在校园网中,我们在宿舍,教室和图书馆接入的校园网,每次的IP都是不相同(共享IP,你要用就给你,不用或用完了还给我)
  • NAT技术,后面介绍
  • IPv6:不是IPv4的升级版,是真正变革性的技术,与IPv4毫不相干,是两种不同的协议,用128字节表示一个地址,但是IPv6还没有普及

四,公网IP和私有IP

如果一个组织内部组件局域网,在这个局域网内,IP地址只用于局域网内地通信,而不直接连接到公网上,理论上使用任何IP都可以,但是为了规范,RFC 1918 规定了用于组件局域网地私有IP地址:

  • 10.* ,前8位是序列号,共16777216个地址
  • 172.16.*到172.31.*,前12位是网络号,共1048576个地址
  • 192.168.*,前16位是网络号,共65536个地址

包含在上面三个范围中地,都成为私有IP,其余地都是公网IP,我们连接云服务器时,连接的这个IP就是云服务器地公网IP:

同时,我们也可以通过ifconfig这个命令来查看我们这台机器私有IP:

在我们Windows的cmd控制台上输入ipconfig命令,也可以看到大量以192.168开头的私有IP:

在我们的使用生涯中,我们从一开始使用的IP其实都是私有IP,在云服务器中才接触到公网IP

问题:数据是如何发送到服务器的?

解答:路由器上有两种网络接口,分别是LAN口IP,WAN口IP:

  • LAN口(Local Area Network):表示连接本地网络的端口,主要与局域网中的交换机,集线器或PC主机相连,LAN口IP也叫做子网IP
  • WAN口(Wide Area Network):表示连接广域网的端口,一般指互联网,WAN口IP也叫做外网IP

我们使用的电脑,家用路由器,运营商路由器,广域网以及我们要访问的服务器之间的关系大致如下:

  • 不同的路由器,子网IP其实是一样的(通常都是192.168.1.1),子网内主机IP不能重复,但是不同子网的IP地址可以重复
  • 我们的家里的路由器连接的一定是运营商的IP,所以我们家里的路由器与运营商其实是构建成一个子网的,所以我们家里路由器的WAN口IP也是运营商路由器的内网IP
  • 所以我们的报文出去的时候,它会做一种策略:会将源IP替换成每一个路由器的WAN口IP;所以上面我们的请求从家用路由器出去后,dst不变仍为122.77.241.3,WAN口IP会被替换成10.1.1.2也就是家用路由器的WAN口IP,然后交给运营商路由器
  • 然后运营商路由器再次替换src为运营商路由器的WAN口IP,这样依次转发,最后到达对方主机时,dst不变,src就变成了对方路由器的WAN口IP --> 这种不断替换私有IP的过程我们叫做 ------ NAT技术
  • IP资源不够,所以用这种策略,用公网IP构建网络的话,IP资源是远远不够的,所以就介入到上面这种模式,可以极大减少主机数,私有IP全由路由器维护,所以互联网 = 私有IP + 共有IP,前者主要给底层路由器的主机用,后者主要给路由器用
    问题:为什么私有IP不能出现在公网中?

解答

  • 不同局域网中主机的IP可能是相同的,所以私有IP不能标识唯一的一台主机,所以私有IP不能出现在公网中
  • 而且也因为IP地址不足的问题,我们不能让主机直接使用公网IP,私有IP的重复也意味着我们可以在不同的局域网中使用相同的IP地址,环节二IP不足

五,理解运营商和全球网络

问题:我们是怎么上网的?

解答

  • 有运营商的工作人员拉网线,然后光纤入户。需要两个设备,一个是调制解调器(猫),路由器,一般是两个盒子。

  • 光纤里面有很多玻璃丝,用来传输光信号或者高低电平,然后光纤插到解调器上,解调器的作用是模拟信号转数字,数字信号转模拟,计算机只认识01序列,所以解调器将模拟信号转化成数字信号后转给家用路由器

  • 但是光拉网线不行,还得"交钱",然后就会给你家路由器一个账号和密码之后,路由器才能上网。

  • 同时,路由器还有一个功能就是构建局域网,然后我们的wifi就可以看到了路由器名字了,但是我怕别人来蹭网,于是在除了运营商的账号密码外,还有一个路由器账号和密码,所以路由器里面存在着两套账号密码
    关于运营商

  • 在上网前有一个步骤非常重要:网络基础设施建设,基础设施建设好了,网民就多了,接着就会孵化出大大小小的互联网公司,然后提供更多工作岗位,推动经济发展

  • 但是这个基础建设,是非常耗时耗力的,而且回报周期很长,所以一般的私人企业不愿意做这种活儿,所以咱们国内的那三个公司肯定也不愿意做,但是我们国家"要求"你这么做,同时国家也会大力扶持国企进行基础设施建设,"强迫"运营商去建设

  • 在20年前,手机的流量费是非常贵的,下个图片可能5毛钱就没了,所以基础设施搞好,还要降流量费,这样才会有更多人进来

  • 而且你不仅要城里的人能上网,还得要村里的人也能上网,所以需要很多基层的工作人员下基层安装维护设备,就是来你家里安装网线的人

  • 如果运营商没钱了,国家就来给补给,所以有一个强大的国家,才会有我们国家如此丰富的网络基础设施,让人随时随地都可以上网
    关于全球网络

  • IP地址是一份大的资源, 在分配的时候不是按国家大小来分配的,一般是按照国家组织地区人口综合评估来分发的IP个数的

  • 各个国家是有自己的国际路由器的,这个路由器彼此都是连接的,就类似于我们前面的学生会主席,我们国家的子网掩码是0000 0010 0000 0000 0000 0000 0000 0000,也就是前8位0000 0010

  • 前面8个比特位就不用了,然后每个省也有自己的省路由器,34个省,2^6,然后我们就可以拿着前面的6个比特位来进行编号,然后6+8=14,所以子网掩码就是14位,之后国际路由器也就可以和我们的国内路由器进行通信了

  • 然后每个省有很多市,然后再次分配4个比特位进行编号,到了市路由器之后,子网就变成了14+4=18了。

  • 然后这个地区的ip开头就都是同样的的,假设西安是0000 0010这是国际掩码,然后0000 10这是省路由器掩码,然后00 10这是市编码,后面就是主机号了

  • 一共是0000 0010 0000 1000 1000 0000 0000 0000,换成点分十进制就是2.8.128.5

  • 当一个外国人要想访问2.8.128.5时,先转化为0000 0010.0000 1000.1000 0000,最后一个就是5 --> 0000 0101 ,先发现不是他国内的IP,然后把请求交给美国国际路由器,然后扔到群里面,艾特中国路由器,然后中国路由器再把请求在国内的省路由器群里面艾特了西安,然后到了西安后,西安再问,最后找到2.6.126.5的主机,进行访问

  • 而当请求到了我们国内路由器,之后的所有工作都是由运营商做的

六,路由

主机A要把数据发给主机B,是要先根据目标IP,经过路由完成转发,实际是一跳一跳转发的

我们可以查看当前主机的路由表:

IP数据包的传输过程中会遇到很多路由器,每当数据包到一个路由器后,路由器会查看该数据的目的IP地址,并告知数据下一跳该往哪跳

问题:查路由表是怎么查的呢?

解答:拿着目标主机的IP地址,按位与&上路由表中的子网掩码,然后和Destination做对比,如果比对不成功,如果不是就直接对比下一个掩码和Destination,如果对比成功,那么表示目标网络正确,就通过eth0把数据发送出去

我们查路由器表,会有下面四种结果:

  • 路由器不知道下一跳要去哪(这种情况基本不会发生,如果发生就是该路由器没配置好,算法设计有问题。)
  • 给你转到下一跳
  • 路由器不清楚,但是会给我们转入默认路由
  • 已经到达目标局域网的入口路由器

对于转入默认路由,一般是"同网段的另一台路由器",但是一个子网一般只有一个路由器,所以我们连接的路由器一般都是子网IP对应的1号路由器,如果我判断一个报文的目的IP不是我这个子网的,所以直接交给下一跳

七,IP报文的分片与组装

实际上在一台主机上,报文并没有通过网络层直接发出去,而是继续交给了自己的下一层协议(数据链路层,属于网卡的驱动层,还有物理层),数据链路再去转发给路由器或者同一个网段的主机。

但是数据链路层,无法一次发送过大的报文,所以就要求上层不能给我交付过大的报文

ifconfig命令可以查看当前协议栈的一些信息,其中上面红框框的 mtu 表示当前的数据链路层的MAC帧一次最多发送1500字节的数据,这个数据包括IP的报头和IP的有效载荷

但是,如果一个报文超过1500字节,但是又数据链路层又不得不发,这时候就会对报文进行分片, 而且既然有分片,那么必定有组装,所以就要求IP报头里包含分片组装的相关信息:

  • 其中16位标识就是IP报文的编号,分片之后的IP报文编号是相同的
  • 对于3位标志位字段,第二位为0,标识允许切片,第三位用来结束标记,表示当前是否是最后一个小片,是的话为0,不是为1
  • 对于13位偏移,假设一个报文都分成了很多片,这个偏移量表示这个小片在原来的大报文里的偏移量,用于组装报文
  • 对于分片后的每个IP报文,都会重新添加IP报头的

问题:如何组装的?

解答

  1. 先确保将所有的分片全都聚在一起(相通的标识)
  2. 然后通过片偏移排序(完成组装),去掉报头然后拼接
    问题:我如何知道一个IP报文是分片报文呢?

解答

  • 只要我收到了后面的切片部分,那么片偏移一定不为0 ,如果片偏移为0,我们还有个三位标识符的结束标识,简单来说,如果一个IP报文不是分片的,那么片偏移=0,更多分片=0,一个不为0那么就是分片的
  • 总结:片偏移 != 0 || 更多分片 == 1,只要符合任意一个条件,就说明这个IP是被分片的
    问题:如何知道切片报文是否丢失?

解答:丢失报文有丢失,那么一般是三种情况:1,丢第一个 2,丢中间的 3,丢最后一个

  • 如果丢了第一个,如果根据片偏移排序时没有一个报文的片偏移是0的,就能甄别出来
  • 如果丢最后一个,收到的报文没有任何一个更多分片结束标记为0,那么就认为丢最后一个
  • 对于丢中间,在进行排序时,第一个报文长度就是下一个报文的片偏移,假设三个1500长度的报文,第一个片偏移是0,排完序后第二个直接就是3000了,但是我们两个报文片偏移加起来才1500,那么我可以认为第二个报文丢了,识别出丢中间
    问题:建不建议分片呢?

解答不建议。因为在IP当中,如果有任意一个分片丢失导致组装失败,那么在Tcp看来就相当于整个报文丢失了,会进行全部重发,所以分片可能会增加丢包概率,降低传输效率

相关推荐
赴前尘19 分钟前
go 模拟TCP粘包和拆包,及解决方法
网络·tcp/ip·golang
IT 青年1 小时前
计算机网络 (18)使用广播信道的数据链路层
计算机网络
maply1 小时前
常用的公共 NTP(网络时间协议)服务器
运维·服务器·网络
网硕互联的小客服1 小时前
如何排查香港服务器上的权限问题
linux·运维·服务器·网络·云计算
请你喝好果汁6411 小时前
玉米中的元基因调控网络突出了功能上相关的调控相互作用。\ca.19a5.R
开发语言·网络·r语言
九河云2 小时前
阿里云DDoS攻击后的恢复时间分析
网络·阿里云·云计算·ddos
小丁爱养花4 小时前
网络原理(六): UDP 协议
网络·tcp/ip·udp
dangdanding9 小时前
udp分片报文发送和接收
linux·网络·python·网络协议·udp
小春学渗透10 小时前
DAY176内网对抗-信息收集篇&SPN扫描&DC定位&角色区域定性&服务探针&安全防护&凭据获取
服务器·网络·安全·内网攻防
无名前端小白10 小时前
windows 下通过脚本方式实现 类似 Linux keepalived IP 动态绑定效果
服务器·前端·网络