目录
[1. 套接字](#1. 套接字)
[1.1 在Linux平台下构建套接字](#1.1 在Linux平台下构建套接字)
[1.1.1 用于接听的套接字(服务器端套接字)](#1.1.1 用于接听的套接字(服务器端套接字))
[1.1.2 用于发送请求的套接字(客户端套接字)](#1.1.2 用于发送请求的套接字(客户端套接字))
[1.2 在Windows平台下构建套接字](#1.2 在Windows平台下构建套接字)
[1.2.1 Winsock的初始化](#1.2.1 Winsock的初始化)
[1.2.2 用于接听的套接字(服务器端套接字)](#1.2.2 用于接听的套接字(服务器端套接字))
[1.2.3 用于发送请求的套接字(客户端套接字)](#1.2.3 用于发送请求的套接字(客户端套接字))
[1.3 Linux和Windows套接字的区别](#1.3 Linux和Windows套接字的区别)
[1.4 套接字特性](#1.4 套接字特性)
[1.4.1 socket函数](#1.4.1 socket函数)
[1.4.1.1 协议族信息(domain形参)](#1.4.1.1 协议族信息(domain形参))
[1.4.1.2 套接字类型(Type形参)](#1.4.1.2 套接字类型(Type形参))
[1.4.1.2.1 面向连接的套接字(SOCK_STREAM)](#1.4.1.2.1 面向连接的套接字(SOCK_STREAM))
[1.4.1.2.2 面向消息的套接字(SOCK_DGRAM)](#1.4.1.2.2 面向消息的套接字(SOCK_DGRAM))
[1.4.1.3 协议的最终选择(protocol形参)](#1.4.1.3 协议的最终选择(protocol形参))
[2. 地址族和数据序列](#2. 地址族和数据序列)
[2.1 网络地址](#2.1 网络地址)
[2.1.1 IPv4(常用)](#2.1.1 IPv4(常用))
[2.1.1.1 网络地址和主机地址](#2.1.1.1 网络地址和主机地址)
[2.1.2 端口号](#2.1.2 端口号)
[2.1.3 bind函数](#2.1.3 bind函数)
[2.1.3.1 sockaddr_in结构体](#2.1.3.1 sockaddr_in结构体)
[2.1.4 网络字节序](#2.1.4 网络字节序)
[2.1.5 字节序转换](#2.1.5 字节序转换)
[2.1.6 网络地址的初始化和分配](#2.1.6 网络地址的初始化和分配)
[2.1.6.1 inet_addr函数](#2.1.6.1 inet_addr函数)
[2.1.6.2 inet_aton函数(Windows不存在此函数)](#2.1.6.2 inet_aton函数(Windows不存在此函数))
[2.1.6.3 inet_ntoa函数(和inet_aton函数相反)](#2.1.6.3 inet_ntoa函数(和inet_aton函数相反))
[2.1.6.4 INADDR_ANY常数](#2.1.6.4 INADDR_ANY常数)
[2.1.6.5 WSAStringToAddress函数(只有Windows平台有,不利于兼容性)](#2.1.6.5 WSAStringToAddress函数(只有Windows平台有,不利于兼容性))
[2.1.6.6 WSAAddressToString函数(只有Windows平台有,不利于兼容性)](#2.1.6.6 WSAAddressToString函数(只有Windows平台有,不利于兼容性))
[2.1.6.7 服务器端初始化IP地址时非常明确,为什么还要进行IP的初始化呢?](#2.1.6.7 服务器端初始化IP地址时非常明确,为什么还要进行IP的初始化呢?)
[3.1 进入连接等待状态(listen函数)](#3.1 进入连接等待状态(listen函数))
[3.2 受理客户端连接请求(accpet函数)](#3.2 受理客户端连接请求(accpet函数))
[3.3 客户端请求连接(connect函数)](#3.3 客户端请求连接(connect函数))
[4. 基于TCP的服务器端/客户端函数调用关系](#4. 基于TCP的服务器端/客户端函数调用关系)
网络编程:编写程序使两台连网的计算机进行数据交换。
1. 套接字
操作系统提供名为套接字的部件,套接字是网络数据传输用的软件设备,它能够连接到因特网上,与远程计算机进行数据传输。
1.1 在Linux平台下构建套接字
**对于Linux而言,socket操作与文件操作没有区别。**如:close函数不仅可以关闭文件也可以关闭套接字。
1.1.1 用于接听的套接字(服务器端套接字)
第一步:调用socket函数创建套接字
cpp
#include<sts/socket.h>
int socket(int domain,int type,int protocol);
成功返回文件描述符,失败返回-1
第二步:调用bind函数分配IP地址和端口号
cpp
#include<sts/socket.h>
int bind(int sockfd,struct sockaddr* myaddr,socklen_t addrlen);
成功返回0,失败返回-1
第三步:调用listen函数转为可接收请求状态
cpp
#include<sts/socket.h>
int listen(int sockfd,int backlog);
成功返回0,失败返回-1
第四步:调用accept函数受理连接请求
cpp
#include<sts/socket.h>
int accept(int sockfd,struct sockaddr* addr,socklen_t* addrlen);
成功返回文件描述符,失败返回-1
accpet函数一直等待,直到有连接请求时,才会有返回值。
第五步:调用write函数发送数据
cpp
#include<unistd.h>
ssize_t write(int fd,const void* buf,size_t nbytes);
成功则返回写入的字节数,失败返回-1
fd:文件描述符参数
buf:保存要传输数据的缓冲地址值
nbytes:要传输数据的字节数
第六步:关闭套接字
cpp
#include<unistd.h>
int close(int fd);
成功返回0,失败返回-1
fd:文件描述符参数。
close函数不仅可以关闭文件也可以关闭套接字。
1.1.2 用于发送请求的套接字(客户端套接字)
第一步:调用socket函数创建套接字
如上。
第二步:调用connect函数连接服务器端
cpp
#include<sts/socket.h>
int connect(int sockfd,struct sockaddr* serv_addr,socklen_t addrlen);
成功返回0,失败返回-1
第三步:调用read函数读取服务器传输的信息
cpp
#include<unistd.h>
ssize_t read(int fd,void *buf,size_t nbytes);
成功则返回接收的字节数(但遇到文件结尾则返回0),失败返回-1
fd:数据接收对象的文件描述符参数
buf:保存接收数据的缓冲地址值
nbytes:要接收数据的字节数
第四步:关闭套接字
如上。
1.2 在Windows平台下构建套接字
在Windows平台下构建套接字要先进行Winsock的初始化。
1.2.1 Winsock的初始化
初始化版本库
cpp
#include<winsock2.h>
int WSAStartup(WORD wVersionRequested,LPWSADATA lpWSAData);
成功返回0,失败返回非0的错误代码值
wVersionRequested:WORD是通过typedef定义的unsigned short类型,这个参数是提供套接字版本信息。可借助MAKEWORD宏函数来构建版本信息,如:
cpp
MAKEWORD(1,2); //主版本为1,副版本为2,返回0x0201
MAKEWORD(2,2); //主版本为2,副版本为2,返回0x0202
lpWSAData:传入WSADATA型结构体变量地址(LPWSADATA是WSADATA的指针类型),调用完函数后会将相关参数,填充到这个参数里。
cpp
WSADATA wsaData;
if(WSAStartup(MAKEWORD(2,2),&wsaData)!=0)
{
......
}
注销版本库
cpp
#include<winsock2.h>
int WSACleanup(void);
成功返回0,失败返回SOCKET_ERROR
销毁Winsock相关库,无法再调用Winsock相关函数。
1.2.2 用于接听的套接字(服务器端套接字)
第一步:调用socket函数创建套接字
cpp
#include <winsock2.h>
SOCKET socket(int af,int type,int protocol);
成功返回套接字句柄,失败返回INVALID_SOCKET
第二步:调用bind函数分配IP地址和端口号
cpp
#include <winsock2.h>
int bind(SOCKET s,const struct sockaddr* name,int namelen);
成功返回0,失败返回SOCKET_ERROR
第三步:调用listen函数转为可接收请求状态
cpp
#include <winsock2.h>
int listen(SOCKET s,int backlog);
成功返回0,失败返回SOCKET_ERROR
第四步:调用accept函数受理连接请求
cpp
#include <winsock2.h>
SOCKET accept(SOCKET s,struct sockaddr* addr,int* addrlen);
成功返回文件描述符,失败返回INVALID_SOCKET
accpet函数一直等待,直到有连接请求时,才会有返回值。
第五步:调用send函数发送数据
cpp
#include<winsock2.h>
int send(SOCKET s,const char* buf,int len,int flags);
成功返回传输字节数,失败返回SOCKET_ERROR
s:表示数据传输对象连接的套接字句柄值
buf: 保存待传输数据的缓冲地址值
len:要传输的字节数
flags:传输数据时用到的多种选项信息
第六步:关闭套接字
cpp
#include <winsock2.h>
int closeconnect(SOCKET s);
成功返回0,失败返回SOCKET_ERROR
1.2.3 用于发送请求的套接字(客户端套接字)
第一步:调用socket函数创建套接字
如上。
第二步:调用connect函数连接服务器端
cpp
#include <winsock2.h>
int connect(SOCKET s,const struct sockaddr* name,int namelen);
成功返回0,失败返回SOCKET_ERROR
第三步:调用recv函数,接收服务器端传来的数据
cpp
#include <winsock2.h>
int recv(SOCKET s,const char* buf,int len,int flags);
成功返回接收的字节数(收到EOF时为0),失败返回SOCKET_ERROR
s:表示数据接收对象连接的套接字句柄值
buf: 保存接收数据的缓冲地址值
len:要接收的最大字节数
flags:接收数据时用到的多种选项信息
第四步:关闭套接字
如上。
1.3 Linux和Windows套接字的区别
-
文件描述符和句柄的区别:
在Linux中,文件描述符是不区分文件和套接字的,即两个都是一样的
在Windows中,句柄是区分文件和套接字的,并不完全一样。
比较两个系统的socket、listen和accept函数,可以发现,其实Linux的int sockfd就对应于Windows的SOCKET s,即SOCKET这个类型,就存有套接字句柄整形值,也类似于一种编号。
-
write和send的区别:
在Linux中,有write也有send函数,来传输数据。
在windows中,send函数只是比Linux中的write函数多了最后的flag参数。
1.4 套接字特性
1.4.1 socket函数
cpp
int socket(
int domain, //套接字中使用的协议族(Protocol Family)信息
int type, //套接字数据传输类型信息
int protocol //计算机间通信中使用的协议信息
);
成功返回文件描述符,失败返回-1
一个socket套接字=协议族+套接字类型+最终协议。
1.4.1.1 协议族信息(domain形参)
协议族:套接字通信中协议的分类。
|-----------------|----------------|
| 名称 | 协议族 |
| PF_INET(常用) | IPv4互联网协议族 |
| PF_INET6 | IPv6互联网协议族 |
| PF_LOCAL | 本地通信的UNIX协议族 |
| PF_PACKET | 底层套接字的协议族 |
| PF_IPX | IPX Novell协议族 |
1.4.1.2 套接字类型(Type形参)
套接字类型:套接字的数据传输方式。
1.4.1.2.1 面向连接的套接字(SOCK_STREAM)
特点:
- 传输过程中数据不会丢失
- 按序传输数据
- 传输的数据不存在数据边界
- 套接字连接必须一一对应
总结:可靠的、按序传递的、基于字节的面向连接的数据传输方式的套接字。注意接收和发送数据大小要相等。
特点:传输过程中数据不会丢失、传输的数据不存在数据边界,解释:
在接收的套接字内部,有一个由字节数组组成的缓冲区,从传输端传过来的数据会先存储到这个缓冲区里,如果缓冲区满了,那么传输端就会停止传输,等待缓冲区中的数据被读取完,再继续传输。其中传输出错,也会进行重传服务,除特殊情况外,不会有数据丢失。
1.4.1.2.2 面向消息的套接字(SOCK_DGRAM)
特点:
- 快速传输
- 传输的数据可能丢失、损毁
- 传输的数据有数据边界
- 限制每次传输的大小
总结:不可靠的,不按序传递的、以数据的高速传输为目的的套接字,不存在连接的概念。注意接收和发送数据次数要相等。
特点:传输的数据具有数据边界,解释:
每次传输都有大小限制,如果超过了这个限制,那么就得分批发送,即意味着接收数据的次数应和传输次数相同。而面向连接的套接字,没有这个要求。
1.4.1.3 协议的最终选择(protocol形参)
第三个参数的意义:同一协议族中存在多个数据传输方式相同的协议。
与套接字类型对应的:
- 面向连接的套接字:TCP套接字(IPPROTO_TCP),注意接收和发送数据大小要相等。
- 面向消息的套接字:UDP套接字(IPPROTO_UDP),注意接收和发送数据次数要相等。
2. 地址族和数据序列
IP(Internet Protocol网络协议):为收发网络数据而分配给计算机的值。
端口号:区分程序中创建的套接字而分配给套接字的序号。
2.1 网络地址
分为两类:IPv4(4字节地址族)、IPv6(16字节地址族)。
2.1.1 IPv4(常用)
IPv4标准的4字节IP地址,由网络地址 和主机地址组成。
2.1.1.1 网络地址和主机地址
IPv4分为如下A、B、C、D四种类型:
通过首字节可以判断其属于哪种类型:
|----------|----|
| 首字节范围 | 类型 |
| 0~127 | A |
| 128~191 | B |
| 192~223 | C |
向对应IP地址主机传输数据,是先通过网络地址,查找到对应的路由器或交换机,再由路由器或交换机,根据主机ID将数据分发到主机上。如图:将数据发送到203.211.172.103上,会先找到网络地址为203.211.172的路由器,路由器再通过主机ID:103将数据传输给对应主机。
2.1.2 端口号
端口号由16位构成,可分配端口号范围为0~65535,但0~1023是知名端口号,会分配给特定应用程序,所以应当分配此范围之外的值。另外,虽然端口号不能重复,但TCP套接字和UDP套接字不会共用端口号,所以允许重复。例如:某TCP套接字用了9130端口,则其余TCP套接字不能使用此端口,但UDP套接字可以使用9130端口。
2.1.3 bind函数
cpp
#include<sts/socket.h>
int bind(int sockfd,struct sockaddr* myaddr,socklen_t addrlen);
成功返回0,失败返回-1
2.1.3.1 sockaddr_in结构体
sockaddr_in:保存IPv4地址信息的结构体。
cpp
struct sockaddr_in
{
sa_family_t sin_family; //地址族
uint16_t sin_port; //16位TCP/UDP端口号
struct in_addr sin_addr; //32位IP地址
char sin_zero[8]; //不使用
}
struct in_addr
{
in_addr_t s_addr; //32位IPv4地址
}
struct sockaddr
{
sa_family_t sin_family; //地址族
char sa_data[14]; //地址信息
}
数据类型是POSIX(可移植操作系统接口),POSIX是为UNIX系列操作系统设立的标准。
1.sin_family成员
2.sin_port成员
保存16位端口号,是以网络字节序保存的。
3.sin_addr成员
保存32位IP地址信息,也是以网络字节序保存的。
4.sin_zero成员
无特殊含义。只是为了使结构体sockaddr_in和sockaddr结构体大小保持一致插入的成员。
为什么我们平常的使用,要先填充 sockaddr_in结构体,再转换为sockaddr结构体,而不直接填充sockaddr结构体呢?
答:因为sockaddr结构体中sa_data[14]数据的填充很麻烦,其中需包含IP地址和端口号,并且其余部分都要填充为0,才能使用。不如直接使用sockaddr_in结构体,再进行转换。填充复杂的原因是sockaddr结构体并不仅仅为IPv4而设计。
2.1.4 网络字节序
不同CPU中,向内存保存数据的方式有两种,一种是正序,直接保存,一种是倒序保存,这意味着,CPU解析数据的方式也分为两种:
- 大端序:高位字节存放到低位地址
- 小端序:高位字节存放到高位地址
所以,在数据传输时,必须统一方式,这种方式就称为网络字节序,即统一为大端序。即先把数据统一转化为大端序的格式,再进行网络传输,所以在填充sin_addr成员和sin_port成员时需要以网络字节序保存。
2.1.5 字节序转换
主机字节序和网络字节序的相互转换,被称为字节序转换。有以下函数进行转换:
cpp
unsigned short htons(unsigned short); //把short类型数据从主机字节序转换为网络字节序
unsigned short ntohs(unsigned short); //把short类型数据从网络字节序转换为主机字节序
unsigned long htonl(unsigned long); //把long类型数据从主机字节序转换为网络字节序
unsigned long ntohl(unsigned long); //把long类型数据从网络字节序转换为主机字节序
htons中的h表示主机(host)字节序。
htons中的n表示网络(network)字节序。
htons中的s指的是short(short占2个字节,所以常用于端口号的转换)。
htonl中的l值得是long(Linux中long类型占4个字节,所以常用于IP地址的转换)。
2.1.6 网络地址的初始化和分配
2.1.6.1 inet_addr函数
cpp
#include <arpa/inet.h>
in_addr_t inet_addr(const char *string);
成功则返回32位大端序整数型值,失败则返回INADDR_NONE
这个函数帮助我们将字符串形式的IP地址转换为32位整数型数据,同时也会进行网络字节序转换。 同时它也会检测无效的IP地址。
2.1.6.2 inet_aton函数(Windows不存在此函数)
inet_aton函数和inet_addr函数功能上相同。
cpp
#include <arpa/inet.h>
int inet_aton(const char *string,struct in_addr* addr);
成功则返回1,失败则返回0
string:含有需转换的IP地址信息的字符串地址值。
addr:将保存转换结果的in_addr结构体变量的地址值。
2.1.6.3 inet_ntoa函数(和inet_aton函数相反)
cpp
#include <arpa/inet.h>
char* inet_ntoa(struct in_addr* addr);
成功则返回转换的字符串地址值,失败则返回-1
将网络字节序32位整数型IP地址转换为字符串形式。
注意:在使用此函数时,返回的结果是一个指针,指向字符串信息的地址,当第二次使用这个函数时,这个地址存有的字符串信息会被覆盖掉,所以在使用时,需要立即拷贝保存地址存有的字符串信息。
2.1.6.4 INADDR_ANY常数
cpp
struct sockaddr_in addr;
memset(&addr,0,sizeof(addr));
...
addr.sin_addr.s_addr=htonl(INADDR_ANY);
INADDR_ANY常数:采用这种方式,会自动获取运行服务器端的计算机的IP地址,不必亲自输入,并且,若同一计算机中分配有多个IP地址(路由器这种),则只要端口号一致,就可以从不同IP地址里接收数据。所以服务器端优先考虑这种方式。
2.1.6.5 WSAStringToAddress函数(只有Windows平台有,不利于兼容性)
各种类型都是针对默认类型的typedef声明。
cpp
#include <winsock2.h>
INT WSAStringToAddress
(
LPTSTR AddressString,INT AddressFamily,LPWSAPROTOCOL_INFO lpProtocolInfo,
LPSOCKADDR lpAddress,LPINT lpAddressLength
);
成功返回0,失败返回SOCKET_ERROR
AddressString:含有IP地址和端口号的字符串地址值
AddressFamily:第一个参数中地址所属的地址族信息
lpProtocolInfo:设置协议提供者(Provider),默认为NULL
lpAddress:保存地址信息的结构体变量地址值
lpAddressLength:第四个参数中传递的结构体长度所在的变量地址值。
2.1.6.6 WSAAddressToString函数(只有Windows平台有,不利于兼容性)
各种类型都是针对默认类型的typedef声明。
cpp
#include <winsock2.h>
INT WSAAddressToString
(
LPSOCKADDR lpsaAddress,DWORD dwAddressLength,
LPWSAPROTOCOL_INFO lpProtocolInfo,LPTSTR lpszAddressString,
LPDWORD lpdwAddressStringLength
);
成功返回0,失败返回SOCKET_ERROR
lpsaAddress:需要转换的地址信息结构体变量地址值
dwAddressLength:第一个参数中结构体的长度
lpProtocolInfo:设置协议提供者(Provider),默认为NULL
lpszAddressString:保存转换结果的字符串地址值
lpdwAddressStringLength:第四个参数中存有地址信息的字符串长度
2.1.6.7 服务器端初始化IP地址时非常明确,为什么还要进行IP的初始化呢?
因为:同一个计算机可能分配有多个IP地址,实际IP地址和计算机安装的NIC数量相等。所以服务器需要决定应接收哪个IP地址传来的数据,所以要服务器端要初始化IP地址。
3.其余流程函数
3.1 进入连接等待状态(listen函数)
当调用了listen函数,服务器端会阻塞,等待连接请求状态。意味着,只有在此之后客户端才能调用connect函数。
cpp
#include<sts/socket.h>
int listen(
int sockfd, //希望进入等待连接请求状态的套接字文件描述符,传递的描述符套接字参数为服务器端套接字
int backlog //连接请求等待队列的长度。
);
成功返回0,失败返回-1
如图:
客户端连接请求本身也是从网络中接收到的一种数据,而接收数据就需要套接字,所以第一个参数服务器端套接字,就是充当门卫,可回复客户端请求,传输"请求已收到"的信号数据。第二个参数就是可以规定,连接请求等候的队列的大小,一般与服务器端特性有关,像频繁请求的web端则至少要15。
3.2 受理客户端连接请求(accpet函数)
cpp
#include<sys/socket.h>
int accpet(
int sock, //服务器套接字的文件描述符
struct sockaddr* addr, //保存发起连接请求的客户端地址信息的变量地址值
socklen_t* addrlen //第二个参数的结构体长度。
);
成功则返回套接字文件描述符,失败则返回-1
accpet函数,受理连接请求等待队列中,待处理的客户端连接请求。函数调用成功,accept函数内部会产生用于数据I/O的套接字,并返回其文件描述符。这个套接字是自动创建的,并自动与发起连接请求的客户端建立连接。
3.3 客户端请求连接(connect函数)
cpp
#include<sys/socket.h>
int connect(
int sock, //客户端套接字文件描述符
struct sockaddr* servaddr, //保存目标服务器端地址信息的变量地址值
socklen_t addrlen //第二个参数的变量长度
);
成功返回0,失败返回-1
connect函数只有以下情况之一才会返回:
- 服务器端接收连接请求,所谓的"连接请求",并不意味着服务器端调用accpet函数,而是服务器端把连接请求信息记录到等待队列中。所以connect函数返回后并不立即进行数据交换。
- 发生断网等异常情况而中断连接请求
4. 基于TCP的服务器端/客户端函数调用关系
图中的总体流程整理如下:服务器端创建套接字后连续调用bind、listen函数进入等待状态,客户端通过调用connect函数发起连接请求。需要注意的是,客户端只能等到服务器端调用listen函数后才能调connect函数。同时要清楚,客户端调用connect函数前,服务器端有可能率先调用accept函数。当然,此时服务器端在调用accept函数时进入阻塞( blocking)状态,直到客户端调connect函数为止。