前言:
上文我们讲到了,讲到了对于网络的初步认识,知道了网络一系列基本概念【Linux网络】初识网络,网络的基础概念-CSDN博客
本文正对上文的套接字,来认识套接字在函数接口的认识,在编程上的使用;最终模拟实现服务器与客户端,来深入理解套接字。
Socket编程预备
理解传入数据的目的
**IP地址在网络中标记主机唯一性。**源主机通过目标主机的IP地址,将数据传输给目标主机。
但将数据传输给主机是目的吗?不是!因为数据最终都是给人用的,将数据传输给主机只是手段。比如:QQ聊天,其实是人在聊;浏览网页数据,其实是人在浏览。
**那么,人应该如何获取对应的数据呢?通过启动对应的应用程序获得!**比如:想要获得聊天消息,就要启动QQ等聊天程序;想要获取网页数据,就要启动浏览器。
而对应的应用程序都是进程。换句话说,进程就是人在计算机中的代表,只要把数据交给对应的进程,就相当于交给了人。
所以,数据传输到主机并不是目的,而是手段;最终将数据交给对应的进程才是目的!

认识端口号
我们现在知道了数据传输给目标主机后,最终目的是将数据交给对应的进程。但是计算机中有不计其数的进程,如何交给正确的进程呢?端口号,正是解决这一问题的答案!
**端口号(port)**是传输层协议的内容。
端口号用于标识一台计算机中唯一的进程。其本质是一个2字节16位的整数。
一个端口号只能被一个进程占用,但一个进程可以拥有多个端口号。只需确保一个端口号对应唯一一个进程即可。
通过**IP地址 + 端口号,我们就可以得到全网唯一的一个进程!**于是我们惊讶的发现:网络通信的本质,其实就是进程间通信!

端口号范围划分
**0~1023:知名端口号,**如HTTP,FTP,SSH等。这些广为使用的应用层协议,它们的端口号都是固定的!
1024~65535:这个范围才是我们能够使用的端口号。 不过端口号是由OS动态分配的,我们并不能指定端口号。
理解端口号与PID
我们讲端口号port是标识计算机中唯一的进程,但是我们也知道PID也是标识计算机中唯一的进程。那为什么不使用PID,而又引用端口号来标识呢?
因为如果我们用PID代替端口号,那么操作系统与网络就会产生强耦合!而我们追求的高内聚,低耦合。所以就并没有这么做。
理解源端口号与目的端口号
传输成协议(TCP与UDP)的数据段中有两个端口号,分别叫做源端口号 与目标端口号 。其本质就是在描述:谁发送的数据、要发给谁。
理解套接字socket
我们上面讲到了IP + 端口号标识了全网唯一的一个进程。
我们把 IP + 端口号 就叫做套接字socket,它能在整个网络里唯一确定一个进程,方便网络中不同进程通过它来通信。
简单认识传输层协议
传输层是属于OS内核的,用户想要调用任何接口,使用任何功能都必须调用对应的系统调用。传输层协议有两个经典代表:UDP、TCP

TCP协议
TCP(Transmission Control Protocol,传输控制协议)
其特点为:
**有链接:**通信前需要先建立链接。比如打电话,想要通信必须拨打电话并且等待对方接通。
**可靠传输:**确保数据准确有效到达。
**面向字节流:**以字节为单位传输数据。
UDP协议
UDP(User Dategram Protocol,用户数据报协议)
其特点为:
**无链接:**通信前不想要建立链接。比如对讲机,想要通信时直接发送信息即可,不需要等待谁。
**不可靠传输:**不确保数据准确有效到达。
**面向数据报:**以独立数据为单位传输。
网络字节序
我们知道计算机是分为大端机与小端机的。
大端机意思是,其内部的数据是按照大端存储的,既高位数据放在低地址处,低位数据放在高地址处。
小端机意思是,其内部的数据是按照小端存储的,既高位数据放在高地址处,低位数据放在低地址处。
发送数据的主机通常将缓冲区中的数据,按照内存地址从低到高发送。但对于大小端主机来说,就算是相同的数据,发送后也会变得不一样!
所以,为了保证大小端主机发送信息的一致性。TCP/IP协议规定:网络数据流应采用大端字节序。
不论大小端主机,都必须遵守这个协议。大端主机发送数据不影响,而小段主机发送数据时,必须先将数据转化为大端,再进行发送!
其中,为了让代码在不同的大小端机器上具备可移植性,我们可以使用以下库函数,来完成网络字节序与主机字节序的转化
cpp
#include <arpa/inet.h>
//主机字节序 转 网络字节序
uint32_t htonl(uint32_t hostlong);
uint16_t htons(uint16_t hostshort);
//网络字节序 转 主机字节序
uint32_t ntohl(uint32_t netlong);
uint16_t ntohs(uint16_t netshort);
函数名很好记:
h标识host,n表示network,l表示32为长整数,n表示16位短整数
如果主机是小端机,这些函数就会进行相应的转化
如果主机是大端机,这些函数将不会执行转化工作
Socket编程接口
cpp
// 创建 socket ⽂件描述符 (TCP/UDP, 客⼾端 + 服务器)
int socket(int domain, int type, int protocol);
// 绑定端⼝号 (TCP/UDP, 服务器)
int bind(int socket, const struct sockaddr *address, socklen_t address_len);
// 开始监听socket (TCP, 服务器)
int listen(int socket, int backlog);
// 接收请求 (TCP, 服务器)
int accept(int socket, struct sockaddr* address, socklen_t* address_len);
// 建⽴连接 (TCP, 客⼾端)
int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
Sockadd结构体
我们注意到在Socket接口中,存在参数为struct sockeaddr* 的参数。下面我们来认识一下这个参数。

套接字socket执行的通信标准是POSIX标准。而POSIX标准是包含了网络通信与本地通信的,这也就意味着执行这套标准的socket要支持多种通信方式。
但socket的实现者,不想提供多个针对于不同通信的接口,只想提供一个接口来完成多种通信方式。于是结构体Sockeaddr诞生了!
通过结构体的内存布局兼容实现:struct sockaddr作为基类,struct sockaddr_in与struct sockaddr_un作为子类继承基类、实现多态的作用。struct sockaddr_in用于网络通信,struct sockaddr_un用于本地通信。这样就实现了一个接口多种通信功能。