网络基础概念

网络基础概念
- 计算机网络背景
- - 网络发展
- 初识协议
- 协议分层
- 再识协议
- - [为什么要有 TCP/IP 协议？](#为什么要有 TCP/IP 协议？)
  - [什么是 TCP/IP 协议？](#什么是 TCP/IP 协议？)
  - [TCP/IP 协议与操作系统的关系](#TCP/IP 协议与操作系统的关系)
  - 所以究竟什么是协议？
- 网络传输基本流程
- - 局域网网络传输流程图
  - - 局域网(以太网为例)通信原理
    - [认识 MAC 地址](#认识 MAC 地址)
    - 数据包封装和分用
  - 跨网络传输流程图
  - - [网络中的地址管理 - 认识 IP 地址](#网络中的地址管理 - 认识 IP 地址)
- Socket编程基础
- - [1. 理解源 IP 地址和目的 IP 地址](#1. 理解源 IP 地址和目的 IP 地址)
  - [2. 认识端口号](#2. 认识端口号)
  - - 端口号范围划分
    - [理解 "端口号" 和 "进程 ID"](#理解 "端口号" 和 "进程 ID")
    - 理解源端口号和目的端口号
    - [理解 socket](#理解 socket)
  - [3. 传输层的典型代表](#3. 传输层的典型代表)
  - - [认识 TCP 协议](#认识 TCP 协议)
    - [认识 UDP 协议](#认识 UDP 协议)
  - [4. 网络字节序](#4. 网络字节序)
  - [5.socket 编程接口](#5.socket 编程接口)
  - - [socket 常见 API](#socket 常见 API)
    - [sockaddr 结构](#sockaddr 结构)
    - [in_addr 结构](#in_addr 结构)

网络基础概念

计算机网络背景

网络发展

独立模式：计算机之间相互独立

-
网络互联：多台计算机连接在一起,完成数据共享
局域网（LAN）与广域网（WAN）：计算机数量更多了, 通过交换机和路由器连接在一起

广域网 WAN: 将远隔千里的计算机都连在一起;

所谓 "局域网" 和 "广域网" 只是一个相对的概念. 比如, 我们有 "天朝特色" 的广域网, 也可以看做一个比较大的局域网.

初识协议

"协议" 是一种约定. （在语言层我们的协议可以当做是我们的结构体里面约束了我们的字段）
打电话约定电话铃响的次数的约定

计算机之间的传输媒介是光信号和电信号. 通过 "频率" 和 "强弱" 来表示 0 和 1 这样的信息. 要想传递各种不同的信息, 就需要约定好双方的数据格式.

思考: 只要通信的两台主机, 约定好协议就可以了么?

定好协议，但是你用频率表示 01，我用强弱表示 01，就好比我用中国话，你
用葡萄牙语一样，虽然大家可能遵守的一套通信规则，但是语言不同，即是订好了
基本的协议，也是无法正常通信的
所以，完善的协议，需要更多更细致的规定，并让参与的人都要遵守。
计算机生产厂商有很多;
计算机操作系统, 也有很多
计算机网络硬件设备, 还是有很多;
如何让这些不同厂商之间生产的计算机能够相互顺畅的通信? 就需要有人站出
来, 约定一个共同的标准, 大家都来遵守, 这就是网络协议;

协议分层

协议本质也是软件，在设计上为了更好的进行模块化，解耦合，也是被设计成为

层状结构的
分层示例（分层的好处）

我们从两个视角看分层

1.同层之间：我们可以认为两者之间直接进行通信

2.工程师视角：要自上到下进行通信

这样设计就可以帮助我们屏蔽底层的差异，当某层发生变化时只需要改变该层不需要改变其他层。这样每层之间就实现了解耦。
OSI 七层模型
- OSI（Open System Interconnection，开放系统互连）七层网络模型称为开放式系统互联参考模型，是一个逻辑上的定义和规范;
- 把网络从逻辑上分为了 7 层. 每一层都有相关、相对应的物理设备，比如路由器，交换机;
- OSI 七层模型是一种框架性的设计方法，其最主要的功能使就是帮助不同类型的主机实现数据传输;
- 它的最大优点是将服务、接口和协议这三个概念明确地区分开来，概念清楚，理论也比较完整. 通过七个层次化的结构模型使不同的系统不同的网络之间实现可靠的通讯;
- 但是, 它既复杂又不实用; 所以我们按照 TCP/IP 四层模型来讲解
TCP/IP 四层模型

TCP/IP是一组协议的代名词，它还包括许多协议，组成了TCP/IP协议簇.

TCP/IP通讯协议采用了5层的层级结构，每一层都呼叫它的下一层所提供的网络来完成自己的需求.
- 物理层: 负责光/电信号的传递方式. 比如现在以太网通用的网线(双绞线)、早期以太网采用的的同轴电缆(现在主要用于有线电视)、光纤, 现在的 wifi 无线网使用电磁波等都属于物理层的概念。物理层的能力决定了最大传输速率、传输距离、抗干扰性等. 集线器(Hub)工作在物理层.
- 数据链路层: 负责设备之间的数据帧的传送和识别. 例如网卡设备的驱动、帧同步(就是说从网线上检测到什么信号算作新帧的开始)、冲突检测(如果检测到冲突就自动重发)、数据差错校验等工作. 有以太网、令牌环网, 无线 LAN 等标准. 交换机(Switch)工作在数据链路层
- 网络层: 负责地址管理和路由选择. 例如在 IP 协议中, 通过 IP 地址来标识一台主机, 并通过路由表的方式规划出两台主机之间的数据传输的线路(路由). 路由器(Router)工作在网路层
- 传输层: 负责两台主机之间的数据传输. 如传输控制协议 (TCP), 能够确保数据可靠的从源主机发送到目标主机
- 应用层: 负责应用程序间沟通，如简单电子邮件传输（SMTP）、文件传输协议（FTP）、网络远程访问协议（Telnet）等. 我们的网络编程主要就是针对应用层
  
  物理层我们考虑的比较少，我们只考虑软件相关的内容. 因此很多时候我们直接称为TCP/IP 四层模型
  一般而言
- 对于一台主机, 它的操作系统内核实现了从传输层到物理层的内容;
- 对于一台路由器, 它实现了从网络层到物理层;
- 对于一台交换机, 它实现了从数据链路层到物理层;
- 对于集线器, 它只实现了物理层
  但是并不绝对. 很多交换机也实现了网络层的转发; 很多路由器也实现了部分传输层的内容(比如端口转发)

再识协议

为什么要有 TCP/IP 协议？

首先，即便是单机，你的计算机内部，其实都是存在协议的，比如：其他设备和内存通信，会有内存协议。其他设备和磁盘通信，会有磁盘相关的协议，比如：SATA，IDE，SCSI 等。只不过我们感知不到罢了。而且这些协议都在本地主机各自的硬件中，通信的成本、问题比较少（本地通信）
其次，网络通信最大的特点就是主机之间变远了。任何通信特征的变化，一定会带来新的问题，有问题就得解决问题，所以需要新的协议咯。（网络通信 ）
本地通信和网络通信本质都是设备之间进行通信，网络通信可以理解为两个网卡进行通信，只不过网卡之间距离太远。而本地通信各个设备直接通过总线相连，距离短。所以，为什么要有 TCP/IP 协议？本质就是通信主机距离变远了

什么是 TCP/IP 协议？

TCP/IP 协议的本质是一种解决方案
TCP/IP 协议能分层，前提是因为问题们本身能分层
数据链路层负责通过路由转发
网络层负责找到目标主机
传输层负责数据传输以及数据丢失处理
用户层处理数据使用数据

TCP/IP 协议与操作系统的关系

所以究竟什么是协议？

关于协议的朴素理解：所谓协议，就是通信双方都认识的结构化的数据类型因为协议栈是分层的，所以，每层都有双方都有协议，同层之间，互相可以认识对方的协议。

网络传输基本流程

局域网网络传输流程图

局域网(以太网为例)通信原理

首先回答，两台主机在同一个局域网，是否能够直接通信？是的
原理类似上课（老师一人说话所有人都可以收到信息，但老师会指明具体的学生，这就实现了独立通信）
每台主机在局域网上，要有唯一的标识来保证主机的唯一性：mac 地址

认识 MAC 地址

MAC 地址用来识别数据链路层中相连的节点;
长度为 48 位, 及 6 个字节. 一般用 16 进制数字加上冒号的形式来表示(例如:08:00:27:03:fb:19)
在网卡出厂时就确定了, 不能修改. mac 地址通常是唯一的(虚拟机中的 mac 地址不是真实的 mac 地址, 可能会冲突; 也有些网卡支持用户配置 mac 地址
查看mac地址：Linux：ifconfig Windows：ipconfig /all
以太网中，任何时刻，只允许一台机器向网络中发送数据
如果有多台同时发送，会发生数据干扰，我们称之为数据碰撞
所有发送数据的主机要进行碰撞检测和碰撞避免

没有交换机的情况下，一个以太网就是一个碰撞域
局域网通信的过程中，主机对收到的报文确认是否是发给自己的，是通过目标mac 地址判定
这里可以试着从系统角度来理解局域网通信原理初步明白了局域网通信原理，再来看同一个网段内的两台主机进行发送消息的过程

而其中每层都有协议，所以当我进行进行上述传输流程的时候，要进行封装和解包
报头部分，就是对应协议层的结构体字段，我们一般叫做报头
除了报头，剩下的叫做有效载荷
故，报文 = 报头 + 有效载荷

然后，我们在明确一下不同层的完整报文的叫法：

不同的协议层对数据包有不同的称谓,在传输层叫做段(segment),在网络层叫做数据报 (datagram),在链路层叫做帧(frame).
应用层数据通过协议栈发到网络上时,每层协议都要加上一个数据首部(header),称为封装(Encapsulation).
首部信息中包含了一些类似于首部有多长, 载荷(payload)有多长, 上层协议是什么等信息.
数据封装成帧后发到传输介质上,到达目的主机后每层协议再剥掉相应的首部, 根据首部中的 "上层协议字段" 将数据交给对应的上层协议处理

在网络传输的过程中，数据不是直接发送给对方主机的，而是先要自定向下将数据交付给下层协议，最后由底层发送，然后由对方主机的底层来进行接受，在自底向上进行向上交付，因此数据发生要贯穿整个协议栈。

数据包封装和分用

封装：

分用：

学习协议我们要搞懂两点：

要学习的协议，是如何做到解包的？只有明确了解包，封包也就能理解
要学习的协议，是如何做到将自己的有效载荷，交付给上层协议的？

跨网络传输流程图

网络中的地址管理 - 认识 IP 地址

IP 协议有两个版本, IPv4 和 IPv6. 我们整个的课程, 凡是提到 IP 协议, 没有特殊说明的,默认都是指 IPv4

IP 地址是在 IP 协议中, 用来标识网络中不同主机的地址;
对于 IPv4 来说, IP 地址是一个 4 字节, 32 位的整数;
我们通常也使用 "点分十进制" 的字符串表示 IP 地址, 例如 192.168.0.1 ; 用点分割的每一个数字表示一个字节, 范围是 0 - 255;
查看IP地址 Linux:ifconfig Windows:ipconfig /all

跨网段的主机的数据传输. 数据从一台计算机到另一台计算机传输过程中要经过一个或多个路由器(路由器在这里可以看做有两个网卡的主机，有网络层和数据链路层，作用连接不同的局域网 )

首先理解一下 IP 地址的意义：

为什么要去目标主机，先要走路由器？
目的 IP 的意义

对比 IP 地址和 Mac 地址的区别
IP 地址在整个路由过程中，一直不变(目前，我们只能这样说明，后面在修正)
Mac 地址一直在变
目的 IP 是一种长远目标，Mac 是下一阶段目标，目的 IP 是路径选择的重要依
据，mac 地址是局域网转发的重要依据

提炼 IP 网络的意义和网络通信的宏观流程：

IP 网络层存在的意义：提供网络虚拟层，让世界的所有网络都是 IP 网络，屏蔽最底层网络的差异

Socket编程基础

1. 理解源 IP 地址和目的 IP 地址

IP 在网络中，用来标识主机的唯一性

2. 认识端口号

端口号(port)是传输层协议的内容.

端口号是一个 2 字节 16 位的整数;
端口号用来标识一个进程, 告诉操作系统, 当前的这个数据要交给哪一个进程来处理;
IP 地址 + 端口号能够标识网络上的某一台主机的某一个进程;
一个端口号只能被一个进程占用（类似哈希桶我们实现了一个哈希桶映射了我们的进程和我们的端口号）

端口号范围划分

0 - 1023: 知名端口号, HTTP, FTP, SSH 等这些广为使用的应用层协议, 他们的端口号都是固定的.
024 - 65535: 操作系统动态分配的端口号. 客户端程序的端口号, 就是由操作系统从这个范围分配的.

理解 "端口号" 和 "进程 ID"

我们之前在学习系统编程的时候, 学习了 pid 表示唯一一个进程; 此处我们的端口号也是唯一表示一个进程. 那么这两者之间是怎样的关系?

另外, 一个进程可以绑定多个端口号; 但是一个端口号不能被多个进程绑定;

进程 ID 属于系统概念，技术上也具有唯一性，确实可以用来标识唯一的一个进程，但是这样做，会让系统进程管理和网络强耦合，实际设计的时候，并没有选择这样做。

理解源端口号和目的端口号

传输层协议(TCP 和 UDP)的数据段中有两个端口号, 分别叫做源端口号和目的端口号. 就是在描述 "数据是谁发的, 要发给谁"

理解 socket

综上，IP 地址用来标识互联网中唯一的一台主机，port 用来标识该主机上唯一的一个网络进程
IP+Port 就能表示互联网中唯一的一个进程
所以，通信的时候，本质是两个互联网进程代表人来进行通信，{srcIp，srcPort，dstIp，dstPort}这样的 4 元组就能标识互联网中唯二的两个进程
所以，网络通信的本质，也是进程间通信
我们把 ip+port 叫做套接字 socke

3. 传输层的典型代表

如果我们了解了系统，也了解了网络协议栈，我们就会清楚，传输层是属于内核的，那么我们要通过网络协议栈进行通信，必定调用的是传输层提供的系统调用，来进行的网络通信。

认识 TCP 协议

此处我们先对 TCP(Transmission Control Protocol 传输控制协议)有一个直观的认识;后面我们再详细讨论 TCP 的一些细节问题.

传输层协议
有连接（可以理解为但电话时双方要先确认对方在线）
可靠传输
面向字节流（对方发的信息我可以选择一次性接受也可以一点点接受）

认识 UDP 协议

此处我们也是对 UDP(User Datagram Protocol 用户数据报协议)有一个直观的认识; 后面再详细讨论

传输层协议
无连接（就是我们的对讲机）
不可靠传输
面向数据报（对方发多少我收到多少）

4. 网络字节序

我们已经知道,内存中的多字节数据相对于内存地址有大端和小端之分, 磁盘文件中的多字节数据相对于文件中的偏移地址也有大端小端之分, 网络数据流同样有大端小端之分. 那么如何定义网络数据流的地址呢?

发送主机通常将发送缓冲区中的数据按内存地址从低到高的顺序发出;
接收主机把从网络上接到的字节依次保存在接收缓冲区中,也是按内存地址从低到高的顺序保存;
因此,网络数据流的地址应这样规定:先发出的数据是低地址,后发出的数据是高地址.
TCP/IP 协议规定,网络数据流应采用大端字节序,即低地址高字节.
不管这台主机是大端机还是小端机, 都会按照这个 TCP/IP 规定的网络字节序来发送/接收数据;
如果当前发送主机是小端, 就需要先将数据转成大端; 否则就忽略, 直接发送即可;

为使网络程序具有可移植性,使同样的 C 代码在大端和小端计算机上编译后都能正常运行,可以调用以下库函数做网络字节序和主机字节序的转换。
例如 htonl 表示将 32 位的长整数从主机字节序转换为网络字节序,例如将 IP 地址转换后准备发送。
如果主机是小端字节序,这些函数将参数做相应的大小端转换然后返回;
如果主机是大端字节序,这些函数不做转换,将参数原封不动地返回。
判断大小端：

cpp 复制代码

bool help()
{
	int num = 1;
	char* tem = (char*)(&num);
	return (*tem) == 0;
}
int main()
{
	if (help())
	{
		cout << "大端机" << endl;

	}
	else
	{
		cout << "小端机" << endl;
	}

	return 0;
}

5.socket 编程接口

socket 常见 API

c 复制代码

// 创建 socket 文件描述符 (TCP/UDP, 客户端 + 服务器)
int socket(int domain, int type, int protocol);
// 绑定端口号 (TCP/UDP, 服务器)
int bind(int socket, const struct sockaddr *address,
socklen_t address_len);
// 开始监听 socket (TCP, 服务器)
int listen(int socket, int backlog);
// 接收请求 (TCP, 服务器)
int accept(int socket, struct sockaddr* address,
socklen_t* address_len);
// 建立连接 (TCP, 客户端)
int connect(int sockfd, const struct sockaddr *addr,
socklen_t addrlen);

sockaddr 结构

socket API 是一层抽象的网络编程接口,适用于各种底层网络协议,如 IPv4、IPv6,以及后面要讲的 UNIX Domain Socket. 然而, 各种网络协议的地址格式并不相同.

IPv4 和 IPv6 的地址格式定义在 netinet/in.h 中,IPv4 地址用 sockaddr_in 结构体表示,包括 16 位地址类型, 16 位端口号和 32 位 IP 地址.
IPv4、IPv6 地址类型分别定义为常数 AF_INET、AF_INET6. 这样,只要取得某种 sockaddr 结构体的首地址,不需要知道具体是哪种类型的 sockaddr 结构体,就可以根据地址类型字段确定结构体中的内容.
socket API 可以都用 struct sockaddr *类型表示, 在使用的时候需要强制转化成sockaddr_in; 这样的好处是程序的通用性, 可以接收 IPv4, IPv6（网络通信 ）, 以及 UNIX DomainSocket(本地通信) 各种类型的 sockaddr 结构体指针做为参数;

sockaddr 结构

sockaddr_in 结构

虽然 socket api 的接口是 sockaddr, 但是我们真正在基于 IPv4 编程时, 使用的数据结构是 sockaddr_in; 这个结构里主要有三部分信息: 地址类型, 端口号, IP 地址

in_addr 结构

in_addr 用来表示一个 IPv4 的 IP 地址. 其实就是一个 32 位的整数;用来储存ip地址