[C++ 网络协议] 套接字和地址族、数据序列

目录

[1. 套接字](#1. 套接字)

[1.1 在Linux平台下构建套接字](#1.1 在Linux平台下构建套接字)

[1.1.1 用于接听的套接字(服务器端套接字)](#1.1.1 用于接听的套接字(服务器端套接字))

[1.1.2 用于发送请求的套接字(客户端套接字)](#1.1.2 用于发送请求的套接字(客户端套接字))

[1.2 在Windows平台下构建套接字](#1.2 在Windows平台下构建套接字)

[1.2.1 Winsock的初始化](#1.2.1 Winsock的初始化)

[1.2.2 用于接听的套接字(服务器端套接字)](#1.2.2 用于接听的套接字(服务器端套接字))

[1.2.3 用于发送请求的套接字(客户端套接字)](#1.2.3 用于发送请求的套接字(客户端套接字))

[1.3 Linux和Windows套接字的区别](#1.3 Linux和Windows套接字的区别)

[1.4 套接字特性](#1.4 套接字特性)

[1.4.1 socket函数](#1.4.1 socket函数)

[1.4.1.1 协议族信息(domain形参)](#1.4.1.1 协议族信息(domain形参))

[1.4.1.2 套接字类型(Type形参)](#1.4.1.2 套接字类型(Type形参))

[1.4.1.2.1 面向连接的套接字(SOCK_STREAM)](#1.4.1.2.1 面向连接的套接字(SOCK_STREAM))

[1.4.1.2.2 面向消息的套接字(SOCK_DGRAM)](#1.4.1.2.2 面向消息的套接字(SOCK_DGRAM))

[1.4.1.3 协议的最终选择(protocol形参)](#1.4.1.3 协议的最终选择(protocol形参))

[2. 地址族和数据序列](#2. 地址族和数据序列)

[2.1 网络地址](#2.1 网络地址)

[2.1.1 IPv4(常用)](#2.1.1 IPv4(常用))

[2.1.1.1 网络地址和主机地址](#2.1.1.1 网络地址和主机地址)

[2.1.2 端口号](#2.1.2 端口号)

[2.1.3 bind函数](#2.1.3 bind函数)

[2.1.3.1 sockaddr_in结构体](#2.1.3.1 sockaddr_in结构体)

[2.1.4 网络字节序](#2.1.4 网络字节序)

[2.1.5 字节序转换](#2.1.5 字节序转换)

[2.1.6 网络地址的初始化和分配](#2.1.6 网络地址的初始化和分配)

[2.1.6.1 inet_addr函数](#2.1.6.1 inet_addr函数)

[2.1.6.2 inet_aton函数(Windows不存在此函数)](#2.1.6.2 inet_aton函数(Windows不存在此函数))

[2.1.6.3 inet_ntoa函数(和inet_aton函数相反)](#2.1.6.3 inet_ntoa函数(和inet_aton函数相反))

[2.1.6.4 INADDR_ANY常数](#2.1.6.4 INADDR_ANY常数)

[2.1.6.5 WSAStringToAddress函数(只有Windows平台有,不利于兼容性)](#2.1.6.5 WSAStringToAddress函数(只有Windows平台有,不利于兼容性))

[2.1.6.6 WSAAddressToString函数(只有Windows平台有,不利于兼容性)](#2.1.6.6 WSAAddressToString函数(只有Windows平台有,不利于兼容性))

[2.1.6.7 服务器端初始化IP地址时非常明确,为什么还要进行IP的初始化呢?](#2.1.6.7 服务器端初始化IP地址时非常明确,为什么还要进行IP的初始化呢?)

3.其余流程函数

[3.1 进入连接等待状态(listen函数)](#3.1 进入连接等待状态(listen函数))

[3.2 受理客户端连接请求(accpet函数)](#3.2 受理客户端连接请求(accpet函数))

[3.3 客户端请求连接(connect函数)](#3.3 客户端请求连接(connect函数))

[4. 基于TCP的服务器端/客户端函数调用关系](#4. 基于TCP的服务器端/客户端函数调用关系)


网络编程:编写程序使两台连网的计算机进行数据交换。

1. 套接字

操作系统提供名为套接字的部件,套接字是网络数据传输用的软件设备,它能够连接到因特网上,与远程计算机进行数据传输。

1.1 在Linux平台下构建套接字

**对于Linux而言,socket操作与文件操作没有区别。**如:close函数不仅可以关闭文件也可以关闭套接字。

1.1.1 用于接听的套接字(服务器端套接字)

第一步:调用socket函数创建套接字

cpp 复制代码
#include<sts/socket.h>
int socket(int domain,int type,int protocol);
成功返回文件描述符,失败返回-1

第二步:调用bind函数分配IP地址和端口号

cpp 复制代码
#include<sts/socket.h>
int bind(int sockfd,struct sockaddr* myaddr,socklen_t addrlen);
成功返回0,失败返回-1

第三步:调用listen函数转为可接收请求状态

cpp 复制代码
#include<sts/socket.h>
int listen(int sockfd,int backlog);
成功返回0,失败返回-1

第四步:调用accept函数受理连接请求

cpp 复制代码
#include<sts/socket.h>
int accept(int sockfd,struct sockaddr* addr,socklen_t* addrlen);
成功返回文件描述符,失败返回-1

accpet函数一直等待,直到有连接请求时,才会有返回值。

第五步:调用write函数发送数据

cpp 复制代码
#include<unistd.h>
 
ssize_t write(int fd,const void* buf,size_t nbytes);
成功则返回写入的字节数,失败返回-1

fd:文件描述符参数

buf:保存要传输数据的缓冲地址值

nbytes:要传输数据的字节数

第六步:关闭套接字

cpp 复制代码
#include<unistd.h>
     
int close(int fd);
成功返回0,失败返回-1

fd:文件描述符参数。

close函数不仅可以关闭文件也可以关闭套接字。

1.1.2 用于发送请求的套接字(客户端套接字)

第一步:调用socket函数创建套接字

如上。

第二步:调用connect函数连接服务器端

cpp 复制代码
#include<sts/socket.h>
int connect(int sockfd,struct sockaddr* serv_addr,socklen_t addrlen);
成功返回0,失败返回-1

第三步:调用read函数读取服务器传输的信息

cpp 复制代码
#include<unistd.h>
 
ssize_t read(int fd,void *buf,size_t nbytes);
成功则返回接收的字节数(但遇到文件结尾则返回0),失败返回-1

fd:数据接收对象的文件描述符参数

buf:保存接收数据的缓冲地址值

nbytes:要接收数据的字节数

第四步:关闭套接字

如上。

1.2 在Windows平台下构建套接字

在Windows平台下构建套接字要先进行Winsock的初始化。

1.2.1 Winsock的初始化

初始化版本库

cpp 复制代码
#include<winsock2.h>

int WSAStartup(WORD wVersionRequested,LPWSADATA lpWSAData);
成功返回0,失败返回非0的错误代码值

wVersionRequested:WORD是通过typedef定义的unsigned short类型,这个参数是提供套接字版本信息。可借助MAKEWORD宏函数来构建版本信息,如:

cpp 复制代码
MAKEWORD(1,2);       //主版本为1,副版本为2,返回0x0201
MAKEWORD(2,2);       //主版本为2,副版本为2,返回0x0202

lpWSAData:传入WSADATA型结构体变量地址(LPWSADATA是WSADATA的指针类型),调用完函数后会将相关参数,填充到这个参数里。

cpp 复制代码
WSADATA wsaData;
if(WSAStartup(MAKEWORD(2,2),&wsaData)!=0)
{
    ......
}

注销版本库

cpp 复制代码
#include<winsock2.h>

int WSACleanup(void);
成功返回0,失败返回SOCKET_ERROR

销毁Winsock相关库,无法再调用Winsock相关函数。

1.2.2 用于接听的套接字(服务器端套接字)

第一步:调用socket函数创建套接字

cpp 复制代码
#include <winsock2.h>
SOCKET socket(int af,int type,int protocol);
成功返回套接字句柄,失败返回INVALID_SOCKET

第二步:调用bind函数分配IP地址和端口号

cpp 复制代码
#include <winsock2.h>
int bind(SOCKET s,const struct sockaddr* name,int namelen);
成功返回0,失败返回SOCKET_ERROR

第三步:调用listen函数转为可接收请求状态

cpp 复制代码
#include <winsock2.h>
int listen(SOCKET s,int backlog);
成功返回0,失败返回SOCKET_ERROR

第四步:调用accept函数受理连接请求

cpp 复制代码
#include <winsock2.h>
SOCKET accept(SOCKET s,struct sockaddr* addr,int* addrlen);
成功返回文件描述符,失败返回INVALID_SOCKET

accpet函数一直等待,直到有连接请求时,才会有返回值。

第五步:调用send函数发送数据

cpp 复制代码
#include<winsock2.h>
int send(SOCKET s,const char* buf,int len,int flags);
成功返回传输字节数,失败返回SOCKET_ERROR

s:表示数据传输对象连接的套接字句柄值

buf: 保存待传输数据的缓冲地址值

len:要传输的字节数

flags:传输数据时用到的多种选项信息

第六步:关闭套接字

cpp 复制代码
#include <winsock2.h>
int closeconnect(SOCKET s);
成功返回0,失败返回SOCKET_ERROR

1.2.3 用于发送请求的套接字(客户端套接字)

第一步:调用socket函数创建套接字

如上。

第二步:调用connect函数连接服务器端

cpp 复制代码
#include <winsock2.h>
int connect(SOCKET s,const struct sockaddr* name,int namelen);
成功返回0,失败返回SOCKET_ERROR

第三步:调用recv函数,接收服务器端传来的数据

cpp 复制代码
#include <winsock2.h>
int recv(SOCKET s,const char* buf,int len,int flags);
成功返回接收的字节数(收到EOF时为0),失败返回SOCKET_ERROR

s:表示数据接收对象连接的套接字句柄值

buf: 保存接收数据的缓冲地址值

len:要接收的最大字节数

flags:接收数据时用到的多种选项信息

第四步:关闭套接字

如上。

1.3 Linux和Windows套接字的区别

  1. 文件描述符和句柄的区别:

    在Linux中,文件描述符是不区分文件和套接字的,即两个都是一样的

    在Windows中,句柄是区分文件和套接字的,并不完全一样。

    比较两个系统的socket、listen和accept函数,可以发现,其实Linux的int sockfd就对应于Windows的SOCKET s,即SOCKET这个类型,就存有套接字句柄整形值,也类似于一种编号。

  2. write和send的区别:

在Linux中,有write也有send函数,来传输数据。

在windows中,send函数只是比Linux中的write函数多了最后的flag参数。

1.4 套接字特性

1.4.1 socket函数

cpp 复制代码
int socket(
int domain,    //套接字中使用的协议族(Protocol Family)信息
int type,      //套接字数据传输类型信息
int protocol   //计算机间通信中使用的协议信息
);
成功返回文件描述符,失败返回-1

一个socket套接字=协议族+套接字类型+最终协议。

1.4.1.1 协议族信息(domain形参)

协议族:套接字通信中协议的分类。

|-----------------|----------------|
| 名称 | 协议族 |
| PF_INET(常用) | IPv4互联网协议族 |
| PF_INET6 | IPv6互联网协议族 |
| PF_LOCAL | 本地通信的UNIX协议族 |
| PF_PACKET | 底层套接字的协议族 |
| PF_IPX | IPX Novell协议族 |

1.4.1.2 套接字类型(Type形参)

套接字类型:套接字的数据传输方式。

1.4.1.2.1 面向连接的套接字(SOCK_STREAM)

特点:

  1. 传输过程中数据不会丢失
  2. 按序传输数据
  3. 传输的数据不存在数据边界
  4. 套接字连接必须一一对应

总结:可靠的、按序传递的、基于字节的面向连接的数据传输方式的套接字注意接收和发送数据大小要相等。

特点:传输过程中数据不会丢失、传输的数据不存在数据边界,解释:

在接收的套接字内部,有一个由字节数组组成的缓冲区,从传输端传过来的数据会先存储到这个缓冲区里,如果缓冲区满了,那么传输端就会停止传输,等待缓冲区中的数据被读取完,再继续传输。其中传输出错,也会进行重传服务,除特殊情况外,不会有数据丢失。

1.4.1.2.2 面向消息的套接字(SOCK_DGRAM)

特点:

  1. 快速传输
  2. 传输的数据可能丢失、损毁
  3. 传输的数据有数据边界
  4. 限制每次传输的大小

总结:不可靠的,不按序传递的、以数据的高速传输为目的的套接字,不存在连接的概念注意接收和发送数据次数要相等。

特点:传输的数据具有数据边界,解释:

每次传输都有大小限制,如果超过了这个限制,那么就得分批发送,即意味着接收数据的次数应和传输次数相同。而面向连接的套接字,没有这个要求。

1.4.1.3 协议的最终选择(protocol形参)

第三个参数的意义:同一协议族中存在多个数据传输方式相同的协议

与套接字类型对应的:

  1. 面向连接的套接字:TCP套接字(IPPROTO_TCP),注意接收和发送数据大小要相等。
  2. 面向消息的套接字:UDP套接字(IPPROTO_UDP),注意接收和发送数据次数要相等。

2. 地址族和数据序列

IP(Internet Protocol网络协议):为收发网络数据而分配给计算机的值。

端口号:区分程序中创建的套接字而分配给套接字的序号。

2.1 网络地址

分为两类:IPv4(4字节地址族)、IPv6(16字节地址族)。

2.1.1 IPv4(常用)

IPv4标准的4字节IP地址,由网络地址主机地址组成。

2.1.1.1 网络地址和主机地址

IPv4分为如下A、B、C、D四种类型:

通过首字节可以判断其属于哪种类型:

|----------|----|
| 首字节范围 | 类型 |
| 0~127 | A |
| 128~191 | B |
| 192~223 | C |

向对应IP地址主机传输数据,是先通过网络地址,查找到对应的路由器或交换机,再由路由器或交换机,根据主机ID将数据分发到主机上。如图:将数据发送到203.211.172.103上,会先找到网络地址为203.211.172的路由器,路由器再通过主机ID:103将数据传输给对应主机。

2.1.2 端口号

端口号由16位构成,可分配端口号范围为0~65535,但0~1023是知名端口号,会分配给特定应用程序,所以应当分配此范围之外的值。另外,虽然端口号不能重复,但TCP套接字和UDP套接字不会共用端口号,所以允许重复。例如:某TCP套接字用了9130端口,则其余TCP套接字不能使用此端口,但UDP套接字可以使用9130端口。

2.1.3 bind函数

cpp 复制代码
#include<sts/socket.h>
int bind(int sockfd,struct sockaddr* myaddr,socklen_t addrlen);
成功返回0,失败返回-1

2.1.3.1 sockaddr_in结构体

sockaddr_in:保存IPv4地址信息的结构体

cpp 复制代码
struct sockaddr_in
{
    sa_family_t    sin_family;    //地址族
    uint16_t       sin_port;      //16位TCP/UDP端口号
    struct in_addr sin_addr;      //32位IP地址
    char           sin_zero[8];   //不使用
}

struct in_addr
{
    in_addr_t      s_addr;        //32位IPv4地址
}

struct sockaddr
{
    sa_family_t    sin_family;        //地址族
    char           sa_data[14];       //地址信息
}

数据类型是POSIX(可移植操作系统接口),POSIX是为UNIX系列操作系统设立的标准。

1.sin_family成员

2.sin_port成员

保存16位端口号,是以网络字节序保存的。

3.sin_addr成员

保存32位IP地址信息,也是以网络字节序保存的。

4.sin_zero成员

无特殊含义。只是为了使结构体sockaddr_in和sockaddr结构体大小保持一致插入的成员。

为什么我们平常的使用,要先填充 sockaddr_in结构体,再转换为sockaddr结构体,而不直接填充sockaddr结构体呢?

答:因为sockaddr结构体中sa_data[14]数据的填充很麻烦,其中需包含IP地址和端口号,并且其余部分都要填充为0,才能使用。不如直接使用sockaddr_in结构体,再进行转换。填充复杂的原因是sockaddr结构体并不仅仅为IPv4而设计。

2.1.4 网络字节序

不同CPU中,向内存保存数据的方式有两种,一种是正序,直接保存,一种是倒序保存,这意味着,CPU解析数据的方式也分为两种:

  1. 大端序:高位字节存放到低位地址
  2. 小端序:高位字节存放到高位地址

所以,在数据传输时,必须统一方式,这种方式就称为网络字节序,即统一为大端序。即先把数据统一转化为大端序的格式,再进行网络传输,所以在填充sin_addr成员sin_port成员时需要以网络字节序保存。

2.1.5 字节序转换

主机字节序和网络字节序的相互转换,被称为字节序转换。有以下函数进行转换:

cpp 复制代码
unsigned short htons(unsigned short);    //把short类型数据从主机字节序转换为网络字节序
unsigned short ntohs(unsigned short);    //把short类型数据从网络字节序转换为主机字节序
unsigned long htonl(unsigned long);      //把long类型数据从主机字节序转换为网络字节序
unsigned long ntohl(unsigned long);       //把long类型数据从网络字节序转换为主机字节序

htons中的h表示主机(host)字节序。

htons中的n表示网络(network)字节序。

htons中的s指的是short(short占2个字节,所以常用于端口号的转换)。

htonl中的l值得是long(Linux中long类型占4个字节,所以常用于IP地址的转换)。

2.1.6 网络地址的初始化和分配

2.1.6.1 inet_addr函数

cpp 复制代码
#include <arpa/inet.h>
in_addr_t inet_addr(const char *string);
成功则返回32位大端序整数型值,失败则返回INADDR_NONE

这个函数帮助我们将字符串形式的IP地址转换为32位整数型数据,同时也会进行网络字节序转换。 同时它也会检测无效的IP地址

2.1.6.2 inet_aton函数(Windows不存在此函数)

inet_aton函数和inet_addr函数功能上相同。

cpp 复制代码
#include <arpa/inet.h>
int inet_aton(const char *string,struct in_addr* addr);
成功则返回1,失败则返回0

string:含有需转换的IP地址信息的字符串地址值。

addr:将保存转换结果的in_addr结构体变量的地址值。

2.1.6.3 inet_ntoa函数(和inet_aton函数相反)

cpp 复制代码
#include <arpa/inet.h>
char* inet_ntoa(struct in_addr* addr);
成功则返回转换的字符串地址值,失败则返回-1

将网络字节序32位整数型IP地址转换为字符串形式

注意:在使用此函数时,返回的结果是一个指针,指向字符串信息的地址,当第二次使用这个函数时,这个地址存有的字符串信息会被覆盖掉,所以在使用时,需要立即拷贝保存地址存有的字符串信息

2.1.6.4 INADDR_ANY常数

cpp 复制代码
struct sockaddr_in addr;
memset(&addr,0,sizeof(addr));
...
addr.sin_addr.s_addr=htonl(INADDR_ANY);

INADDR_ANY常数:采用这种方式,会自动获取运行服务器端的计算机的IP地址,不必亲自输入,并且,若同一计算机中分配有多个IP地址(路由器这种),则只要端口号一致,就可以从不同IP地址里接收数据。所以服务器端优先考虑这种方式。

2.1.6.5 WSAStringToAddress函数(只有Windows平台有,不利于兼容性)

各种类型都是针对默认类型的typedef声明。

cpp 复制代码
#include <winsock2.h>
INT WSAStringToAddress
(
    LPTSTR AddressString,INT AddressFamily,LPWSAPROTOCOL_INFO lpProtocolInfo,
    LPSOCKADDR lpAddress,LPINT lpAddressLength
);
成功返回0,失败返回SOCKET_ERROR

AddressString:含有IP地址和端口号的字符串地址值

AddressFamily:第一个参数中地址所属的地址族信息

lpProtocolInfo:设置协议提供者(Provider),默认为NULL

lpAddress:保存地址信息的结构体变量地址值

lpAddressLength:第四个参数中传递的结构体长度所在的变量地址值。

2.1.6.6 WSAAddressToString函数(只有Windows平台有,不利于兼容性)

各种类型都是针对默认类型的typedef声明。

cpp 复制代码
#include <winsock2.h>
INT WSAAddressToString
(
    LPSOCKADDR lpsaAddress,DWORD dwAddressLength,
    LPWSAPROTOCOL_INFO lpProtocolInfo,LPTSTR lpszAddressString,
    LPDWORD lpdwAddressStringLength
);
成功返回0,失败返回SOCKET_ERROR

lpsaAddress:需要转换的地址信息结构体变量地址值

dwAddressLength:第一个参数中结构体的长度

lpProtocolInfo:设置协议提供者(Provider),默认为NULL

lpszAddressString:保存转换结果的字符串地址值

lpdwAddressStringLength:第四个参数中存有地址信息的字符串长度

2.1.6.7 服务器端初始化IP地址时非常明确,为什么还要进行IP的初始化呢?

因为:同一个计算机可能分配有多个IP地址,实际IP地址和计算机安装的NIC数量相等。所以服务器需要决定应接收哪个IP地址传来的数据,所以要服务器端要初始化IP地址。

3.其余流程函数

3.1 进入连接等待状态(listen函数)

当调用了listen函数,服务器端会阻塞,等待连接请求状态。意味着,只有在此之后客户端才能调用connect函数。

cpp 复制代码
#include<sts/socket.h>
int listen(
int sockfd,            //希望进入等待连接请求状态的套接字文件描述符,传递的描述符套接字参数为服务器端套接字
int backlog            //连接请求等待队列的长度。
);
成功返回0,失败返回-1

如图:

客户端连接请求本身也是从网络中接收到的一种数据,而接收数据就需要套接字,所以第一个参数服务器端套接字,就是充当门卫,可回复客户端请求,传输"请求已收到"的信号数据。第二个参数就是可以规定,连接请求等候的队列的大小,一般与服务器端特性有关,像频繁请求的web端则至少要15。

3.2 受理客户端连接请求(accpet函数)

cpp 复制代码
#include<sys/socket.h>
int accpet(
int sock,                //服务器套接字的文件描述符
struct sockaddr* addr,   //保存发起连接请求的客户端地址信息的变量地址值
socklen_t* addrlen       //第二个参数的结构体长度。
);
成功则返回套接字文件描述符,失败则返回-1

accpet函数,受理连接请求等待队列中,待处理的客户端连接请求。函数调用成功,accept函数内部会产生用于数据I/O的套接字,并返回其文件描述符。这个套接字是自动创建的,并自动与发起连接请求的客户端建立连接。

3.3 客户端请求连接(connect函数)

cpp 复制代码
#include<sys/socket.h>
int connect(
int sock,                    //客户端套接字文件描述符
struct sockaddr* servaddr,   //保存目标服务器端地址信息的变量地址值
socklen_t addrlen            //第二个参数的变量长度
);
成功返回0,失败返回-1

connect函数只有以下情况之一才会返回:

  1. 服务器端接收连接请求,所谓的"连接请求",并不意味着服务器端调用accpet函数,而是服务器端把连接请求信息记录到等待队列中。所以connect函数返回后并不立即进行数据交换。
  2. 发生断网等异常情况而中断连接请求

4. 基于TCP的服务器端/客户端函数调用关系

图中的总体流程整理如下:服务器端创建套接字后连续调用bind、listen函数进入等待状态,客户端通过调用connect函数发起连接请求。需要注意的是,客户端只能等到服务器端调用listen函数后才能调connect函数。同时要清楚,客户端调用connect函数前,服务器端有可能率先调用accept函数。当然,此时服务器端在调用accept函数时进入阻塞( blocking)状态,直到客户端调connect函数为止。

相关推荐
闲晨2 分钟前
C++ 继承:代码传承的魔法棒,开启奇幻编程之旅
java·c语言·开发语言·c++·经验分享
UestcXiye1 小时前
《TCP/IP网络编程》学习笔记 | Chapter 3:地址族与数据序列
c++·计算机网络·ip·tcp
霁月风3 小时前
设计模式——适配器模式
c++·适配器模式
jrrz08283 小时前
LeetCode 热题100(七)【链表】(1)
数据结构·c++·算法·leetcode·链表
咖啡里的茶i3 小时前
Vehicle友元Date多态Sedan和Truck
c++
海绵波波1073 小时前
Webserver(4.9)本地套接字的通信
c++
@小博的博客3 小时前
C++初阶学习第十弹——深入讲解vector的迭代器失效
数据结构·c++·学习
石牌桥网管4 小时前
OpenSSL 生成根证书、中间证书和网站证书
网络协议·https·openssl
爱吃喵的鲤鱼4 小时前
linux进程的状态之环境变量
linux·运维·服务器·开发语言·c++
7年老菜鸡5 小时前
策略模式(C++)三分钟读懂
c++·qt·策略模式