OSI****七层模型
OSI ( Open System Interconnection ,开放系统互连)七层网络模型称为开放式系统互联参考模型,是一个逻辑上的定义和规范,其把网络从逻辑上分为了 7 层 . 每一层都有相关、相对应的物理设备,比如路由器,交换机;
OSI 七层模型是一种框架性的设计方法,其最主要的功能使就是帮助不同类型的主机实现数据传输。它的最大优点是将服务、接口和协议这三个概念明确地区分开来,概念清楚,理论也比较完整. 通过七个层次化的结构模型使不同的系统不同的网络之间实现可靠的通讯。但是, 它既复杂又不实用, 所以我们按照 TCP/IP 四层模型来讲解。
**TCP/IP五层(或四层)**模型
TCP/IP 是一组协议的代名词,它还包括许多协议,组成了 TCP/IP 协议簇 . TCP/IP 通讯协议采用了 5 层的层级结构,每一层都呼叫它的下一层所提供的网络来完成自己的需求。
- 物理层: 负责光/电信号的传递方式. 比如现在以太网通用的网线(双绞线)、早期以太网采用的的同轴电缆(现在主要用于有线电视)、光纤, 现在的 wifi 无线网使用电磁波等都属于物理层的概念。物理层的能力决定了最大传输速率、传输距离、抗干扰性等. 集线器(Hub)工作在物理层.
- 数据链路层: 负责设备之间的数据帧的传送和识别. 例如网卡设备的驱动、帧同步(就是说从网线上检测到什么信号算作新帧的开始)、冲突检测(如果检测到冲突就自动重发)、数据差错校验等工作. 有以太网、令牌环网, 无线 LAN 等标准. 交换机(Switch)工作在数据链路层.
- 网络层: 负责地址管理和路由选择. 例如在 IP 协议中, 通过 IP 地址来标识一台主机, 并通过路由表的方式规划出两台主机之间的数据传输的线路(路由). 路由器(Router)工作在网路层.
- 传输层: 负责两台主机之间的数据传输. 如传输控制协议 (TCP), 能够确保数据可靠的从源主机发送到目标主机.
- 应用层: 负责应用程序间沟通,如简单电子邮件传输(SMTP)、文件传输协议(FTP)、网络远程访问协议(Telnet)等. 我们的网络编程主要就是针对应用层.
网络协议
网络协议是计算机网络中进行数据交换而建立的规则、标准或约定的集合。它就像是一种网络通信中的"语言",使得不同设备之间能够相互理解和通信。
为什么要有协议?
- 确保通信的准确性
网络中的设备(如计算机、路由器、服务器等)由不同厂商生产,具有不同的操作系统和硬件结构。网络协议规定了数据的格式、传输顺序、错误检测和纠正等机制,确保数据在不同设备之间准确无误地传输。例如,在发送一封电子邮件时,网络协议确保邮件内容按照正确的格式从发送者的设备传输到接收者的设备,而不会出现乱码或数据丢失的情况。
- 实现设备间的互操作性
不同类型的网络设备需要协同工作才能实现网络功能。网络协议为这些设备提供了统一的通信标准,使得它们能够相互识别和交互。例如,一个计算机网络可能包含了多种品牌的路由器、交换机和终端设备,通过遵循相同的网络协议(如TCP/IP协议),这些设备能够构建起一个互联互通的网络,实现数据的共享和传输。
通信原理
信息封装与解封:发送端从上到下对数据进行封装,每一层都在数据前添加本层的协议头,如应用层添加应用协议头,传输层添加 TCP 或 UDP 协议头,网络层添加 IP 协议头,数据链路层添加帧头,形成最终的数据包在物理介质上传输。接收端则自下而上进行解封,去除各层协议头,将数据还原并交给相应的应用程序。
关于协议的朴素理解:所谓协议,就是通信双方都认识的结构化的数据类型。因为协议栈是分层的,所以,每层都有双方都有协议,同层之间,互相可以认识对方的协议。
MAC****地址
- MAC 地址用来识别数据链路层中相连的节点
- 长度为 48 位, 即 6 个字节,一般用 16 进制数字加上冒号的形式来表示,如08:00:27:03:fb:19
- 在网卡出厂时就确定了, 不能修改, mac 地址通常是唯一的(虚拟机中的 mac 地址不是真实的 mac 地址, 可能会冲突; 也有些网卡支持用户配置 mac 地址).
- 以太网中,任何时刻,只允许一台机器向网络中发送数据
- 如果有多台同时发送,会发生数据干扰,我们称之为数据碰撞
- 所有发送数据的主机要进行碰撞检测和碰撞避免
- 没有交换机的情况下,一个以太网就是一个碰撞域
- 局域网通信的过程中,主机对收到的报文确认是否是发给自己的,是通过目标 mac 地址判定
初步明白了局域网通信原理,再来看同一个网段内的两台主机进行发送消息的过程。
而其中每层都有协议,所以当我进行进行上述传输流程的时候,要进行封装和解包。
报头部分,就是对应协议层的结构体字段,我们一般叫做报头,除了报头,剩下的叫做有效载荷
故,报文 = 报头 + 有效载荷
- 不同的协议层对数据包有不同的称谓,在传输层叫做段(segment),在网络层叫做数据报(datagram),在链路层叫做帧(frame)。
- 应用层数据通过协议栈发到网络上时,每层协议都要加上一个数据首部(header),称为封装(Encapsulation)。
- 首部信息中包含了一些类似于首部有多长, 载荷(payload)有多长, 上层协议是什么等信息。
- 数据封装成帧后发到传输介质上,到达目的主机后每层协议再剥掉相应的首部, 根据首部中的 "上层协议字段" 将数据交给对应的上层协议处理。
在网络传输的过程中,数据不是直接发送给对方主机的,而是先要自定向下将数据交付给下层协议,最后由底层发送,然后由对方主机的底层来进行接受,在自底向上进行向上交付,下面是一张示意图。
IP 地址
- IP 地址是在 IP 协议中, 用来标识网络中不同主机的地址
- 对于 IPv4 来说, IP 地址是一个 4 字节, 32 位的整数
- 我们通常也使用 "点分十进制" 的字符串表示 IP 地址, 例如 192.168.0.1 ; 用点分割的每一个数字表示一个字节, 范围是 0 - 255
跨网段的主机的数据传输, 数据从一台计算机到另一台计算机传输过程中要经过一个或多个路由器。
然后结合封装与解包,体现路由器解包和重新封装的特点
对比 IP 地址和 Mac 地址的区别
- IP 地址在整个路由过程中,一直不变(目前,我们只能这样说明,后面在修正),Mac 地址一直在变
- 目的 IP 是一种长远目标,Mac 是下一阶段目标,目的 IP 是路径选择的重要依据,mac 地址是局域网转发的重要依据
提炼 IP 网络的意义和网络通信的宏观流程
端口号
- 端口号(port)是传输层协议的内容,端口号用来标识一个进程, 告诉操作系统, 当前的这个数据要交给哪一个进程来处理
- 端口号是一个 2 字节 16 位的整数
- 一个端口号只能被一个进程占用,IP 地址 + 端口号能够标识网络上的某一台主机的某一个进程
理解 " 端口号 " 和 " 进程 ID"
我们知道 pid 表示唯一一个进程, 此处我们的端口号也是唯一表示一个进程. 那么这两者之间是怎样的关系 ?
- 一个进程可以绑定多个端口号; 但是一个端口号不能被多个进程绑定
- 进程 ID 属于系统概念,技术上也具有唯一性,确实可以用来标识唯一的一个进程,但是这样做,会让系统进程管理和网络强耦合,实际设计的时候,并没有选择这样做。
综上, IP 地址用来标识互联网中唯一的一台主机, port 用来标识该主机上唯一的一个网络进程 IP+Port 就能表示互联网中唯一的一个进程,所以通信的时候,本质是两个互联网进程代表人来进行通信,{srcIp,srcPort, dstIp , dstPort} 这样的 4 元组就能标识互联网中唯二的两个进程。所以网络通信的本质,也是进程间通信,我们把 ip+port 叫做套接字 socket
socket
n. (电源 ) 插座; ( 电器上的 ) 插口,插孔,管座;槽;窝;托座;臼;孔穴
vt. 把... 装入插座;给 ... 配插座