1. 基本概念
- 主机:配有IP地址,也要进行路由控制的设备
- 路由器:即配有IP地址,又能进行路由控制
- 节点:主机和路由器的统称
2. 理解 IP 协议
2.1 核心作用
- 核心能力:提供一种能力,把数据报从 A 主机,跨网络,送到 B 主机。
- 特点:IP 协议是尽力而为的交付,即:有非常大的概率完成传输,但不保证 100% 可靠
- 解决的问题:主机到主机的通信问题
- 所以,TCP/IP协议核心就是把数据可靠地,从主机跨网络发送至另一个主机
2.2 IP 地址的构成
IP 地址 = 目标网络 + 目标主机
3. 协议头格式
- 4位版本号:固定为 4,代表 IPv4 协议
- 4位首部长度
- 8位服务类型 TOS:3 位优先权(废弃)+ 4 位 TOS + 1 位保留(恒 0)。4位TOS分别表示:4 项互斥:最小延时、最大吞吐量、最高可靠性、最小成本。这四者相互冲突,只能选择一个。对于SSH/Telnet 选最小延时;FTP 选最大吞吐量
- 16位总长度:整个 IP 数据报的总字节数
- 16位 标识 ID
- 3位标志字段
- 3位分片偏移(这三个后面分片部分细讲)
- 8位TTL 生存时间:默认常见64;每过一台路由减 1,减到 0 直接丢弃,防止路由环路
- 8位协议**:**标识上层承载协议(TCP/UDP/ICMP 等
- 16位首部校验和CRC 校验,只校验IP 首部,判断首部是否损坏
4. 子段划分(重要)
为什么要划分?
可以类比:学校学院划分 ,学校划分之后就可以快速定位到某学院某学生,从而大大提高了查找效率。而提前给 IP 地址分组(划分子网),用 "子网号" 做分组标识,就像学校提前划分学院一样
寻找某学生这一过程,类似于路由器"淘汰"过程------ 先淘汰掉所有不匹配的子网,再在目标子网里找主机,淘汰效率越高,转发效率就越高
再看,IP地址=目标网络号+目标主机号,和学号=学院号+学生序号的逻辑一样
通过合理设置主机号和网络号,就可以保证在相互连接的⽹络中,每台主机的IP地址都不相同。但是动管理子网内的IP,是一个相当麻烦的事情
有⼀种技术叫做**DHCP,**能够自动的给子网内新增主机节点分配IP地址,避免了手动管理IP的不便。一般的路由器都带有DHCP功能。因此路由器也可以看做一个DHCP服务器
为了适配不同主机规模的网络,给大型机构、中型企业、小型局域网分配大小不同的地址段,划分 A、B、C、D、E 五类地址
- A类0.0.0.0到127.255.255.255
- B类128.0.0.0到191.255.255.255
- C类192.0.0.0到223.255.255.255
- D类224.0.0.0到239.255.255.255
- E类240.0.0.0到247.255.255.255
随后,这种方案又出现了局限性:
- A 类:单个网络能容纳千万级主机,普通机构根本用不上,出现大量闲置浪费
- B 类:一个网段就有 65534 台主机大部分企业实际只用几十、几百台,却照样占一整个 B 类段;大家都抢着申请 B 类,B 类很快枯竭
- C 类:网段太小,只有 254 台主机,稍大一点的机构又不够用
针对这种情况提出了新的划分方案,称为CIDR (无类别域间路由),引入一个额外的子网掩码 (subnet mask) 来区分网络号和主机号
5. 子网掩码
- 子网掩码也是一个 32 位的正整数。通常用一串 "0" 来结
- 将 IP 地址和子网掩码进行 "按位与" 操作,得到的结果就是网络号
- 网络号和主机号的划分与这个 IP 地址是A类、B类还是C类无关

IP地址与子网掩码做与运算可以得到网络号,主机号从全0到全1就是子网的地址范围
IP地址和子网掩码还有一种更简洁的表示方法,例如140.252.20.68/24,表示IP地址为140.252.20.68,子网掩码的高24位是1,也就是255.255.255.0
特殊IP地址
- 将IP地址中的主机地址全部设为0,就成为了网络号,代表这个局域网
- 将IP地址中的主机地址全部设为1,就成为了广播地址,用于给同一个链路中相互连接的所有主机发送数据包
- 127.*的IP地址用于本机环回(loop back)测试,通常是127.0.0.1
IP地址的数量限制
IP 地址 (IPv4) 是一个 4 字节 32 位的正整数。那么一共只有 2 的 32 次方 个 IP 地址,大概是 43 亿左右。而 TCP/IP 协议规定,每个主机都需要有一个 IP 地址。这意味着,一共只有 43 亿台主机能接入网络
IP地址存在不够的问题,为了解决;有三种方式:
- 动态分配 IP 地址:只给接入网络的设备分配 IP 地址。因此同一个 MAC 地址的设备,每次接入互联网中,得到的 IP 地址不一定是相同的
- NAT 技术
- IPv6:IPv6 并不是 IPv4 的简单升级版。这是互不相干的两个协议,彼此并不兼容;目前还没有普及
6. 私有IP地址和公网IP地址
如果一个组织内部组建局域网,IP 地址只用于局域网内的通信,而不直接连到 Internet 上,理论上使用任意的 IP 地址都可以,但是 RFC 1918 规定了用于组建局域网的私有 IP 地址
- 10*,前 8 位是网络号,共 16,777,216 个地址
- 172.16*到 172.31*,前 12 位是网络号,共 1,048,576 个地址
- 192.168*,前 16 位是网络号,共 65,536 个地址
包含在这个范围中的,都成为私有 IP,其余的则称为全局 IP(或公网 IP)
- 一个路由器可以配置两个IP地址,一个是 WAN口IP,一个是 LAN口IP (子网 IP)
- 路由器 LAN 口连接的主机,都从属于当前这个路由器的子网中
- 不同的路由器,子网IP其实都是一样的 (通常都是 192.168.1.1)。子网内的主机IP地址不能重复。但是子网之间的IP地址就可以重复了
- 每一个家用路由器,其实又作为运营商路由器的子网中的一个节点。这样的运营商路由器可能会有很多级,最外层的运营商路由器,WAN 口 IP 就是一个公网IP了
- 子网内的主机需要和外网进行通信时,路由器将IP首部中的IP地址进行替换 (替换成 WAN 口 IP),这样逐级替换,最终数据包中的 IP 地址成为一个公网IP。这种技术称为NAT(Network Address Translation,网络地址转换)
7. 尝试理解公网
真实的网络拓扑结构非常复杂,即涉及到划分公网IP的组织,ICANN,分配公网 IP 不是简单按国家为单位,还要在全球范围内进行区域划分, 如亚太,北美,欧洲等,又要考虑各个国家内部的ISP代理。简单理解公网即可
8. 路由

路由的过程,就是这样一跳一跳 (Hop by Hop)"问路" 的过程
所谓 "一跳" 就是数据链路层中的一个区间。具体在以太网中指从源 MAC 地址到目的 MAC 地址之间的帧传输区间
那么如何判定当前这个数据包该发送到哪里呢?这个就依靠每个节点内部维护一个路由表
路由表可以使⽤route命令查看:

假设某主机上的网络接口配置和路由表如下:
这台主机有两个网络接口,一个网络接口连到 192.168.10.0/24 网络,另一个网络接口连到 192.168.56.0/24 网络
路由表的 Destination 是目的网络地址,Genmask 是子网掩码,Gateway 是下一跳地址,Iface 是发送接口,Flags 中的 U 标志表示此条目有效 (可以禁用某些条目),G 标志表示此条目的下一跳地址是某个路由器的地址,没有 G 标志的条目表示目的网络地址是与本机接口直接相连的网络,不必经路由器转发
转发过程例 1: 如果要发送的数据包的目的地址是 192.168.56.3
- 跟第一行的子网掩码做与运算得到 192.168.56.0, 与第一行的目的网络地址不符
- 再跟第二行的子网掩码做与运算得到 192.168.56.0, 正是第二行的目的网络地址,因此从 eth1 接口发送出去
- 由于 192.168.56.0/24 正是与 eth1 接口直接相连的网络,因此可以直接发到目的主机,不需要经路由器转发
转发过程例 2: 如果要发送的数据包的目的地址是 202.10.1.2
- 依次和路由表前几项进行对比,发现都不匹配
- 按缺省路由条目,从 eth0 接口发出去,发往 192.168.10.1 路由器
- 由 192.168.10.1 路由器根据它的路由表决定下一跳地址
9. 分片
因为数据链路层帧有最大长度限制(MTU),IP 数据包太大装不下,网络层就会将原始的IP数据报分割成多个较小的片段

- **16 位标识 (id):**唯一的标识主机发送的报文。如果 IP 报文在数据链路层被分片了,那么每一个片里面的这个 id 都是相同的
- **3 位标志字段:**第一位保留 (保留的意思是现在不用,但是还没想好说不定以后要用到)。第二位置为 1 表示禁止分片,这时候如果报文长度超过 MTU,IP 模块就会丢弃报文。第三位表示 "更多分片",如果分片了的话,最后一个分片置为 0,其他是 1。类似于一个结束标记
- **13 位分片偏移 :**是分片相对于原始 IP 报文开始处的偏移。其实就是在表示当前分片在原报文中处在哪个位置。实际偏移的字节数是这个值乘以 8 得到的。因此,除了最后一个报文之外,其他报文的长度必须是 8 的整数倍 (否则报文就不连续了)
判断报文是否分片?
- 更多分片位为1,1就是分片
- 更多分片为为0,但片偏移量>0
但是网络通信中,如果过多分片,就会导致丢包概率。减少分片
判断是否把分片收全了?
相同标识的分片,聚合在一起
缺少分片?
- 第一片缺失:片偏移量为0
- 中间丢失:按照片偏移量进行升序排序,找到丢失部分(片偏移+自身报文长度=下一片的片偏移量)
- 最后一片丢失:没有更多分片位是0的分片
减少分片的本质?
- 在传输层,也就是传输层交给IP层的报文不能过多---->滑动窗口!