【计算机网络】网络基础概念

📚 博主的专栏

🐧 Linux | 🖥️ C++ | 📊 数据结构| 💡C++ 算法 | 🅒**C 语言 |** 🌐 计算机网络

这是博主计算机网络的第一篇文章,本文由于是基础概念了解,引用了大量课件内容

下篇文章:Socket编程UDP

通过计算机网络的背景,我们可以知道:

计算机是人的工具, 人要协同工作, 注定了网络的产生是必然的

初识协议

• "协议" 是一种约定。

• 打电话约定电话铃响的次数的约定

计算机之间的传输媒介是光信号和电信号。通过 "频率" 和 "强弱" 来表示 0 和 1 这样的信息。要想传递各种不同的信息, 就需要约定好双方的数据格式。

思考: 只要通信的两台主机, 约定好协议就可以了么?

• 定好协议, 但是你用频率表示 01, 我用强弱表示 01, 就好比我用中国话, 你用葡萄牙语一样, 虽然大家可能遵守的一套通信规则, 但是语言不同, 即是订好了基本的协议,也是无法正常通信的。

所以, 完善的协议, 需要更多更细致的规定, 并让参与的人都要遵守

  • 计算机生产厂商有很多;
  • 计算机操作系统, 也有很多;
  • 计算机网络硬件设备, 还是有很多;
  • 如何让这些不同厂商之间生产的计算机能够相互顺畅的通信?

就需要有人站出来, 约定一个共同的标准, 大家都来遵守, 这就是网络协议;

一般具有定制协议或者标准的资格的组织或者公司都必须是业界公认或者具有江湖地位的组织或者公司。


协议分层

• 协议本质也是软件, 在设计上为了更好的进行模块化, 解耦合, 也是被设计成为层状结构的原因

软件分层的好处

  • 在这个例子中, 我们的"协议"只有两层:语言层、 通信设备层。
  • 但是实际的网络通信协议, 设计的会更加复杂, 需要分更多的层
  • 但是通过上面的简单例子, 我们是能理解, 分层可以实现解耦合, 让软件维护的成本更低

OSI 七层模型

  • OSI(Open System Interconnection, 开放系统互连) 七层网络模型称为开放式系统互联参考模型, 是一个逻辑上的定义和规范;(定标准的一批人,不一定是实现标准的一批人)
  • 把网络从逻辑上分为了 7 层. 每一层都有相关、 相对应的物理设备, 比如路由器, 交换机;
  • OSI 七层模型是一种框架性的设计方法, 其最主要的功能使就是帮助不同类型的主机实现数据传输;
  • 它的最大优点是将服务、 接口和协议这三个概念明确地区分开来, 概念清楚,理论也比较完整. 通过七个层次化的结构模型使不同的系统不同的网络之间实现可靠的通讯;
  • 但是, 它既复杂又不实用; 所以我们按照 TCP/IP 四层模型来讲解
  • 其实在网络角度, OSI 定的协议 7 层模型其实非常完善, 但是在实际操作的过程中, 会话层、 表示层是不可能接入到操作系统中的, 所以在工程实践中, 最终落地的是 5 层协议

计算机(语言也是)世界的规律就是,先描述再组织的设计,层状结构

TCP/IP 五层(或四层)模型

TCP/IP 是一组协议的代名词, 它还包括许多协议, 组成了 TCP/IP 协议簇。

TCP/IP 通讯协议采用了 5 层的层级结构, 每一层都呼叫它的下一层所提供的网络完成自己的需求

  • 物理层(解决无线通信的问题): 负责光/电信号的传递方式. 比如现在以太网通用的网线(双绞线)、 早期以太网采用的的同轴电缆(现在主要用于有线电视)、 光纤, 现在的 wifi 无线网使用电磁波等都属于物理层的概念。 物理层的能力决定了最大传输速率、 传输距离、 抗干扰性等。集线器(Hub)工作在物理层
  • 数据链路层 : 负责设备之间的数据帧的传送和识别. 例如网卡设备的驱动、 帧同步(就是说从网线上检测到什么信号算作新帧的开始)、 冲突检测(如果检测到冲突就自动重发)、 数据差错校验等工作。 有以太网、 令牌环网, 无线 LAN 等标准。**交换机(Switch)**工作在数据链路层。
  • 网络层: 负责地址管理和路由选择. 例如在 IP 协议中, 通过 IP 地址来标识一台主机, 并通过路由表的方式规划出两台主机之间的数据传输的线路(路由)。**路由器(Router)**工作在网路层。
  • 传输层: 负责两台主机之间的数据传输****.如传输控制协议 (TCP), 能够确保数据可靠的从源主机发送到目标主机
  • 应用层: 负责应用程序间沟通, 如简单电子邮件传输(SMTP) 、 文件传输协议(FTP) 、 网络远程访问协议(Telnet) 等. 我们的网络编程主要就是针对应用层

物理层我们考虑的比较少, 我们只考虑软件相关的内容. 因此很多时候我们直接称为TCP/IP 四层模型。一般而言:

• 对于一台主机, 它的操作系统内核实现了从传输层到物理层的内容;

• 对于一台路由器, 它实现了从网络层到物理层;

• 对于一台交换机, 它实现了从数据链路层到物理层;

• 对于集线器, 它只实现了物理层

但是并不绝对. 很多交换机也实现了网络层的转发; 很多路由器也实现了部分传输层的内容(比如端口转发)。

为什么要有 TCP/IP 协议?

  • 首先, 即便是单机, 你的计算机内部 , 其实都是存在协议 的, 比如: 其他设备和内存通信, 会有内存协议。 其他设备和磁盘通信, 会有磁盘相关的协议, 比如: SATA, IDE, SCSI 等。 只不过我们感知不到罢了。 而且这些协议都在本地主机各自的硬件中, 通信的成本低、 问题比较少。
  • 其次, 网络通信最大的特点就是主机之间变远了。任何通信特征的变化, 一定会带来新的问题, 有问题就得解决问题, 所以需要新的协议。

发数据不是目的,只是手段、用数据才是目的

  • 所以, 为什么要有 TCP/IP 协议?

本质就是通信主机距离变远了

什么是 TCP/IP 协议?

• TCP/IP 协议的本质是一种解决方案

• TCP/IP 协议能分层, 前提是因为问题们本身能分层

TCP/IP 协议与操作系统的关系(宏观上, 怎么实现的)

  • 所有的主机上面安装的操作系统可以不同、但是所有主机上面的协议栈必须按照标准进行相同的实现,这就是为什么不同的主机,可一互相通信的原因。
  • 网卡就是底层硬件即物理层,数据链路层在驱动程序中、网络层和传输层集成在内核当中。
  • 传输层最著名的协议是TCP 、网络层最著名的协议是IP、传输层(TCP)和网络层(IP)两层必须实现在内核当中,无论OS再怎么不同,这部分大家必须遵守协议必须相同。
  • 由于TCP/IP是核心,因此就将整个协议统称为TCP/IP协议。
  • 由于整个协议栈即涉及到硬件有涉及到OS,以及用户,因此这个协议一定是IT各行各业都要进行支持和配合的。

所以究竟什么是协议?

OS 源代码一般都是用 C/C++语言(偏向于C)写的。

关于协议的朴素理解: 所谓协议**, 就是通信双方都认识的结构化的数据类型因为协议栈是分层的****, 所以, 每层都有双方都有协议, 同层之间, 互相可以认识对方的协议。**

**完整的报文分为:**协议报文、有效载荷


网络传输基本流程

局域网(以太网为例)通信原理

两台主机在同一个局域网, 是否能够直接通信? 是的

• 原理类似上课、老师叫班上的张三(班上只有这个人叫这个名字)、所有人都能听到,但是只有这个张三回应老师。并且他回应老师,所有人依然能听到(但是他们不会回应),老师和张三在说话的时候,其他人都能听到、但是其他人不做处理。教室就相当于一个局域网。老师是src,而张三就是dst其他人发现dst不是他们就不会处理。

• 每台主机在局域网上, 要有唯一的标识保证主机的唯一性mac 地址

认识 MAC 地址(MAC 地址用来识别数据链路层中相连的节点)

• 长度为 48 位, 及 6 个字节。 一般用 16 进制数字加上冒号的形式来表示(例如:08:00:27:03:fb:19)

• 在网卡出厂时就确定了, 不能修改。mac 地址通常是唯一的。

(虚拟机中的 mac 地址不是真实的 mac 地址, 可能会冲突; 也有些网卡支持用户配置 mac 地址)。

临界资源:以太网

以太网 中, 任何时刻只允许一台机器向网络发送数据

• 如果有多台同时发送, 会发生数据干扰, 我们称之为数据碰撞

• 所有发送数据的主机要进行碰撞检测碰撞避免

没有交换机 的情况下, 一个以太网 就是一个碰撞域

• 局域网通信的过程中, 主机对收到的报文确认是否是发给自己的 , 是通过目标mac地址判定

• 这里可以试着从系统角度理解局域网通信原理

初步明白了局域网通信原理, 再来看同一个网段内的两台主机进行发送消息的过程

**从物理上:**用户A发送数据从上往下再通过物理层主机1的网卡,传输到主机2的网卡处,再从下往上传输给用户B

从逻辑上:每一层直接通信(应用层和应用层直接通信)

而其中每层都有协议, 所以当我进行进行上述传输流程的时候, 要进行封装和解包

封装的时候,向下添加每层的报头。每一层的报文就是,自己的报头加上有效载荷。

解包的时候,每一层可以通过报头判断是否是同层级之间的传输,再将当前层对应报头去掉,向上传,也就是除了自己的报头以外,剩余的报文,也就是该层的有效载荷

下面我们明确一下概念

• 报头部分, 就是对应协议层的结构体字段, 我们一般叫做报头

• 除了报头, 剩下的叫做有效载荷

• 报文 = 报头 + 有效载荷

如果从上到下来看整个报文的封装和解包的过程,可以将这个结构看作是一个栈结构,但是每一层都只能看到报文的头部,向下封装的时候每一层需要加该层对应的报头,类似于进栈,向上解包的过程就是去掉报头,类似出栈。也是一个后进先出的过程,因此我们也将tcp/ip叫做网络协议栈。

网络协议的共性

1.数据在网络中发送的时候,一定最终要在硬件上跑

2.除了应用层,每一层协议,都必须要解决一个问题,自己的有效载荷,应该要交给上层的那一种协议!!这就叫做分用

然后, 我们在明确一下不同层的完整报文的叫法

• 不同的协议层对数据包有不同的称谓,在传输层叫做段(segment),在网络层叫做数据报 (datagram),在链路层叫做帧(frame).

• 应用层数据通过协议栈发到网络上时,每层协议都要加上一个数据首部(header),称为封装(Encapsulation).

• 首部信息中包含了一些类似于首部有多长, 载荷(payload)有多长, 上层协议是什么等信息.

• 数据封装成帧后发到传输介质上,到达目的主机后每层协议再剥掉相应的首部,根据首部中的 "上层协议字段" 将数据交给对应的上层协议处理

在网络传输的过程中, 数据不是直接发送给对方主机的, 而是先要自顶向下将数据交付给下层协议, 最后由底层发送, 然后由对方主机的底层来进行接受, 再自底向上进行向上交付。

数据包封装和分用

下图为数据封装的过程

下图为数据分用的过程

学习任何协议, 都要先宏观上建立这样的认识:

  1. 要学习的协议, 是如何做到解包的? 只有明确了解包, 封包也就能理解。

  2. 要学习的协议, 是如何做到将自己的有效载荷, 交付给上层协议的?

网络中的地址管理 - 认识 IP 地址

IP 协议有两个版本, IPv4 和 IPv6. 凡是提到 IP 协议, 没有特殊说明的,默认都是指IPv4
• IP 地址是在 IP 协议中, 用来标识网络中不同主机的地址;

• 对于 IPv4 来说, IP 地址是一个 4 字节, 32 位的整数;

• 我们通常也使用 "点分十进制" 的字符串表示 IP 地址, 例如 192.168.0.1 ; 用点分割的每一个数字表示一个字节, 范围是 0 - 255;

跨网段的主机的数据传输。数据从一台计算机到另一台计算机传输过程中要经过一个或多个路由器。

下面是一张示意图

首先理解一下 IP 地址的意义

• 为什么要去目标主机, 先要走路由器?

• 目的 IP 的意义

路由器连接几个局域网就有几个网卡。

然后结合封装与解包, 体现路由器解包和重新封装的特点

结论:

  • 网络层(IP,包括网络层)向上(包括网络层)看到的所有报文都是一样的,都至少是IP报文
  • IP可以屏蔽底层网络的差异,所有的网络都是IP网络

对比 IP 地址和 Mac 地址的区别

• (公网)IP 地址在整个路由过程中, 一直不变(目前, 我们只能这样说明, 后面在修正)

• Mac 地址一直在变

• 目的 IP 是一种长远目标, Mac 是下一阶段目标, 目的 IP 是路径选择的重要依据, mac 地址是局域网转发的重要依据

为什么:IP地址是最终目标,MAC地址是为了到达最终目标,中途以及最后的目标,阶段性的目标 。

提炼 IP 网络的意义和网络通信的宏观流程

IP 网络层存在的意义: 提供网络虚拟层, 让世界的所有网络都是 IP 网络, 屏蔽最底层网络的差异

编程方面的铺垫:

Socket 编程预备

  1. 理解源 IP 地址和目的 IP 地址
    IP 在网络中, 用来标识主机的唯一性

• 注意: 后面我们会讲 IP 的分类,后面会详细阐述 IP 的特点

但是这里要思考一个问题: 数据传输到主机是目的吗? 不是的。 因为数据是给人用的。 比如:聊天是人在聊天, 下载是人在下载, 浏览网页是人在浏览?

但是人是怎么看到聊天信息的呢? 怎么执行下载任务呢? 怎么浏览网页信息呢? 通过启动的 qq, 迅雷, 浏览器。而启动的 qq, 迅雷, 浏览器都是进程。 换句话说, 进程是人在系统中的代表, 只要把数据给进程, 人就相当于就拿到了数据。

所以:数据传输到主机不是目的, 而是手段。 到达主机内部, 在交给主机内的进程,才是目的。

但是系统中, 同时会存在非常多的进程, 当数据到达目标主机之后, 怎么转发给目标进程? 这就要在网络的背景下, 在系统中, 标识主机的唯一性

端口号port:是传输层协议的内容

网络通信的本质就是进程间通信

• 端口号是一个 2 字节 16 位的整数;
端口号用来标识一个进程 , 告诉操作系统, 当前的这个数据要交给哪一个进程 来处理;
IP 地址(IPA +PORTA) + 端口号 能够标识网络上的 某一台主机的某一个(唯一一个)进程 ;

因此网络间通信的本质就是进程间通信,而今天他们在进行通信的时候就看到了同一份资源,也就是网路

• 一个端口号只能被一个进程占用

任何通信就是两个进程在进行通信。

通过端口号进行转发给指定的进程,换句话说,我们未来写代码的时候,服务器启动的时候,就一定要和指定的port(具有唯一性才是最关键的)进行关联。

在系统中所有进程都有自己的pid,但是不是所有的进程都想进行网络通信,因此只有需要通信的进程需要端口号,也就是有端口号的进程才会进行网络通信。

我们将基于IP和PORT的网络间的通信方式就叫做socket(套接字)通信

• 0 - 1023: 知名端口号, HTTP, FTP, SSH 等这些广为使用的应用层协议, 他们的端口号都是固定的.

• 1024 - 65535: 操作系统动态分配的端口号. 客户端程序的端口号, 就是由操作系统从这个范围分配的

理解源端口号和目的端口号

传输层协议(TCP 和 UDP)的数据段中有两个端口号, 分别叫做源端口号和目的端口号。就是在描述 "数据是谁发的, 要发给谁";

• 综上, IP 地址用来标识互联网中唯一的一台主机, port 用来标识该主机上唯一的一个网络进程

• IP+Port 就能表示互联网中唯一的一个进程

• 所以, 通信的时候, 本质是两个互联网进程代表人来进行通信, {srcIp,srcPort, dstIp, dstPort}这样的 4 元组就能标识互联网中唯二的两个进程

• 所以, 网络通信的本质, 也是进程间通信

• 我们把 ip+port 叫做套接字 socket

传输层的典型代表

• 如果我们了解了系统, 也了解了网络协议栈, 我们就会清楚, 传输层是属于内核的, 那么我们要通过网络协议栈进行通信, 必定调用的是传输层提供的系统调用, 来进行的网络通信。

认识 TCP 协议

此处我们先对 TCP(Transmission Control Protocol 传输控制协议)有一个直观的认识;后面我们再详细讨论 TCP 的一些细节问题.

• 传输层协议

• 有连接

• 可靠传输

• 面向字节流

认识 UDP 协议

此处我们也是对 UDP(User Datagram Protocol 用户数据报协议)有一个直观的认识; 后面再详细讨论.

• 传输层协议

• 无连接

• 不可靠传输

• 面向数据报

网络字节序

发送主机 通常将发送缓冲区中的数据按内存地址从低到高的顺序发出;

接收主机 把从网络上接到的字节依次保存在接收缓冲区 中,也是按内存地址从低到高的顺序保存;

• 因此,网络数据流的地址应这样规定:先发出 的数据是低地址,后发出 的数据是高地址.

• TCP/IP 协议规定,网络数据流应采用大端字节序,低地址高字节.

• 不管这台主机是大端机还是小端机, 都会按照这个 TCP/IP 规定的网络字节序来发送/接收数据;

• 如果当前发送主机是小端 , 就需要先将数据转成大端; 否则就忽略, 直接发送即可

也就是说,接收方,只知道自己接收的是大端,因此要预先处理好

为使网络程序具有可移植性,使同样的 C 代码在大端和小端计算机上编译后都能正常运行,可以调用以下库函数做网络字节序和主机字节序的转换

h-->host n--->net,l ---> long(32位),short(16位) ---> 主机转网络、网络转主机。

• 这些函数名很好记,h 表示 host,n 表示 network,l 表示 32 位 长整数,s 表示 16 位短整数。

• 例如 htonl 表示将 32 位的长整数从主机字节序转换为网络字节序,例如将 IP 地址转换后准备发送。

• 如果主机是小端字节序,这些函数将参数做相应的大小端转换然后返回;

• 如果主机是大端字节序,这些函数不做转换,将参数原封不动地返回。

socket 编程接口

socket():创建套接字

  • 功能:创建一个套接字,用于后续的网络通信。

  • 语法int socket(int domain, int type, int protocol);

  • 参数

    • domain:协议族,如 AF_INET(IPv4)或 AF_INET6(IPv6)。

    • type:套接字类型,如 SOCK_STREAM(TCP)或 SOCK_DGRAM(UDP)。

    • protocol:协议,通常设置为 0,由 type 决定。

  • 返回值 :成功返回套接字描述符,失败返回 -1

bind():绑定套接字到本地地址

  • 功能:将套接字绑定到本地的 IP 地址和端口号。

  • 语法int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

  • 参数

    • sockfd:由 socket() 创建的套接字描述符。

    • addr:指向 sockaddr 结构的指针,包含本地地址信息。

    • addrlenaddr 的长度。

  • 返回值 :成功返回 0,失败返回 -1

listen():监听连接请求

  • 功能:将套接字置于监听状态,等待客户端的连接请求。

  • 语法int listen(int sockfd, int backlog);

  • 参数

    • sockfd:由 socket() 创建的套接字描述符。

    • backlog:未完成连接队列的最大长度。

  • 返回值 :成功返回 0,失败返回 -1

accept():接受客户端连接

  • 功能:接受一个客户端的连接请求,创建一个新的套接字用于与该客户端通信。

  • 语法int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);

  • 参数

    • sockfd:由 socket() 创建的套接字描述符。

    • addr:指向 sockaddr 结构的指针,用于存储客户端的地址信息。

    • addrlenaddr 的长度。

  • 返回值 :成功返回新的套接字描述符,失败返回 -1

recv()read():接收数据

  • 功能:从客户端接收数据。

  • 语法

    • recv()ssize_t recv(int sockfd, void *buf, size_t len, int flags);

    • read()ssize_t read(int fd, void *buf, size_t count);

  • 参数

    • sockfd:套接字描述符。

    • buf:存储接收到的数据的缓冲区。

    • lencount:缓冲区的大小。

    • flags:控制接收行为的标志,通常为 0

  • 返回值 :成功返回接收到的字节数,失败返回 -1,连接关闭返回 0

send()write():发送数据

  • 功能:向客户端发送数据。

  • 语法

    • send()ssize_t send(int sockfd, const void *buf, size_t len, int flags);

    • write()ssize_t write(int fd, const void *buf, size_t count);

  • 参数

    • sockfd:套接字描述符。

    • buf:要发送的数据缓冲区。

    • lencount:要发送的数据长度。

    • flags:控制发送行为的标志,通常为 0

  • 返回值 :成功返回发送的字节数,失败返回 -1

close():关闭套接字

  • 功能:关闭套接字,释放资源。

  • 语法int close(int sockfd);

  • 参数sockfd,套接字描述符。

  • 返回值 :成功返回 0,失败返回 -1

客户端

/ / 创建 socket 文件描述符 (TCP/UDP, 客户端 + 服务器) int socket(int domain, int type, int protocol);

// 绑定端口号 (TCP/UDP, 服务器)

int bind(int socket, const struct sockaddr *address, socklen_t address_len);

// 开始监听 socket (TCP, 服务器) int listen(int socket, int backlog);

// 接收请求 (TCP, 服务器)

int accept(int socket, struct sockaddr* address, socklen_t* address_len);

// 建立连接 (TCP, 客户端)

int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen

sockaddr结构

socket API 是一层抽象的网络编程接口 ,适用于各种底层网络协议 ,如 IPv4、 IPv6 ,以及后面要讲的 UNIX Domain Socket. 然而, 各种网络协议的地址格式并不相同

根据所传的前16位地址中的标志位,判断是要网络通信还是本地通信

我们一般就使用sockaddr_in 结构,实际上,可以联想到sockaddr就是基类,另外两个也就是他的派生类,子类,也就是:多态

  • IPv4 和 IPv6 的地址格式定义在 netinet/in.h 中,IPv4 地址用 sockaddr_in 结构体表示,包括 16 位地址类型, 16 位端口号和 32 位 IP 地址.
  • IPv4、 IPv6 地址类型分别定义为常数 AF_INET、 AF_INET6. 这样,只要取得某种 sockaddr 结构体的首地址,不需要知道具体是哪种类型的 sockaddr 结构体,就可以根据地址类型字段确定结构体中的内容.
  • socket API 可以都用 struct sockaddr *类型表示, 在使用的时候需要强制转化成sockaddr_in; 这样的好处是程序的通用性, 可以接收 IPv4, IPv6, 以及 UNIX Domain Socket 各种类型的 sockaddr 结构体指针做为参数;
    结语:

随着这篇博客接近尾声,我衷心希望我所分享的内容能为你带来一些启发和帮助。学习和理解的过程往往充满挑战,但正是这些挑战让我们不断成长和进步。我在准备这篇文章时,也深刻体会到了学习与分享的乐趣。

在此,我要特别感谢每一位阅读到这里的你。是你的关注和支持,给予了我持续写作和分享的动力。我深知,无论我在某个领域有多少见解,都离不开大家的鼓励与指正。因此,如果你在阅读过程中有任何疑问、建议或是发现了文章中的不足之处,都欢迎你慷慨赐教。

你的每一条反馈都是我前进路上的宝贵财富。同时,我也非常期待能够得到你的点赞、收藏,关注这将是对我莫大的支持和鼓励。当然,我更期待的是能够持续为你带来有价值的内容。

相关推荐
丰锋ff2 小时前
计算机网络学习笔记 4-6章
计算机网络·考研
mooridy8 小时前
计算机网络应用层(5)-- P2P文件分发&视频流和内容分发网
计算机网络
时迁2471 天前
【计算机网络】TCP的四种拥塞控制算法
网络·tcp/ip·计算机网络
简单.is.good2 天前
【计算机网络】IP地址
网络·tcp/ip·计算机网络
浩浩测试一下2 天前
计算机网络中的DHCP是什么呀? 详情解答
android·网络·计算机网络·安全·web安全·网络安全·安全架构
艾厶烤的鱼3 天前
架构-计算机网络
计算机网络·架构
丰锋ff3 天前
计算机网络学习笔记
笔记·学习·计算机网络
尤物程序猿3 天前
【2025计算机网络-面试常问】http和https区别是什么,http的内容有哪些,https用的是对称加密还是非对称加密,流程是怎么样的
计算机网络·http·面试
YGGP4 天前
【每日八股】复习计算机网络 Day4:TCP 协议的其他相关问题
网络·tcp/ip·计算机网络