【网络】Socket套接字

#include <arpa/inet.h>

uint32_t htonl(uint32_t hostlong);
uint16_t htons(uint16_t hostshort);
uint32_t ntohl(uint32_t netlong);
uint16_t ntohs(uint16_t netshort);

其中h表示host，n表示network，l表示32位长整型，s表示16位短整型

例如htonl就是将32位长整型从主机字节序转为网络字节序，适用于转换IP地址

如果主机字节序本身是小端，调用对应库函数后则会将参数做相应大小端转换后返回；如果主机字节序已经是大端了，则不作改变

四、Socket套接字

4.1 概念

套接字（Socket）是一种独立于协议的网络编程接口，是对网络中不同主机的应用进程之间进行双向通信的端点的抽象。套接字上联应用进程，下接网络协议栈，是应用程序与网络协议栈进行交互的接口。

套接字包括 IP 地址和端口号两个部分，可以用来区分不同的进程之间的数据传输。传输层使用的协议不同，套接字的种类也会发生相应的改变。

在Linux中，套接字的本质也是文件，因此有对应的网络文件描述符，用户通过网络文件描述符对套接字进行操作。

4.2 常用API

（1）socket

cpp 复制代码

#include <sys/types.h>
#include <sys/socket.h>

int socket(int domain, int type, int protocol);

socket函数类似于打开文件的操作，会创建套接字并返回一个网络文件描述符，其中：

domain：协议域，又称协议族，例如AF_INET代表IPv4协议，AF_INET6代表IPv6协议
type：指定socket类型，例如流式套接字SOCK_STREAM（TCP）和数据报套接字SOCK_DGRAM（UDP）
protocal：指定协议信息，常见的有IPPROTO_TCP、IPPROTO_UDP等，通常设置为0代表自动选择套接字类型对应的默认协议

创建成功返回一个网络文件描述符，失败返回-1并设置环境变量errno

例如：

（2）bind

cpp 复制代码

#include <sys/types.h>
#include <sys/socket.h>

int bind(int socket, const struct sockaddr *address, socklen_t address_len);

bind函数用于将一个服务的ip地址和端口号绑定到一个套接字上，一般是服务端在绑定监听套接字时会用到。客户端则不必要调用bind绑定，因为客户端的端口号由内核自动分配

其中：

socket：待绑定的网络文件描述符
address：指向一个sockaddr结构体的指针，该结构体包含了要绑定的ip地址和端口号
address_len：address指向的结构体大小

成功绑定返回0，失败返回-1并设置errno

例如：

cpp 复制代码

uint16_t port = 8888; //端口号
string ip = "127.0.0.1"; //字符串格式的ip地址
int sockfd = socket(AF_INET, SOCK_STREAM, 0); //创建套接字
if (sockfd < 0)
{
    // 创建套接字失败时
    //...
}
//填充结构体字段
struct sockaddr_in local;
memset(&local, 0, sizeof(local));
local.sin_family = AF_INET; //IPv4协议
local.sin_port = htons(port);
inet_aton(ip.c_str(), &(local.sin_addr)); 
if (bind(sockfd, (struct sockaddr *)&local, sizeof(local)) < 0) // 绑定
{
    //绑定失败时
    //...
}

填充结构体字段时，需要对端口号进行网络字节序转换和对字符串格式的ip地址转四字节ip地址后再填充到sockaddr_in结构体中

关于ip地址的格式转换函数会在后面提及，这里先简单提一下sockaddr的结构

sockaddr结构

关于socket的API是一层抽象的网络编程接口，适用于各种底层网络协议，如IPv4、IPv6等，但是各种网络协议的地址格式并不相同。

例如IPv4的地址用sockaddr_in结构体表示，其中包含16位地址类型、16位端口号和32位ip地址

不同的结构体中，前16位都填充了ip地址的协议类型，因此我们可以统一用struct sockaddr*类型接收，取得结构体首地址后按位数获取地址类型字段就可以确定是哪一种结构体了。

在使用Unix域套接字进行本机进程间通信时，绑定时就得使用sockaddr_un结构

（3）listen

cpp 复制代码

#include <sys/types.h> 
#include <sys/socket.h>

int listen(int sockfd, int backlog);

listen函数常用于服务端监听来自客户端的TCP连接请求，通常在调用bind函数后使用，成功返回0，失败返回-1并设置errno

其中：

sockfd：将被设置为监听状态的网络文件描述符
backlog：设置全连接队列的长度（全连接队列用于临时维护未被上层accept的已经建立好的连接，长度为backlog+1）

例如：

cpp 复制代码

uint16_t port = 8888; //端口号
string ip = "127.0.0.1"; //字符串格式的ip地址
int sockfd = socket(AF_INET, SOCK_STREAM, 0); //创建套接字
if (sockfd < 0)
{
    // 创建套接字失败时
    //...
}
//填充结构体字段
struct sockaddr_in local;
memset(&local, 0, sizeof(local));
local.sin_family = AF_INET; //IPv4协议
local.sin_port = htons(port);
inet_aton(ip.c_str(), &(local.sin_addr)); 
if (bind(sockfd, (struct sockaddr *)&local, sizeof(local)) < 0) // 绑定
{
    //绑定失败时
    //...
}
if (listen(sockfd, 10) < 0) // 将套接字设置为监听状态，全连接队列最多存放10+1个连接
{
    //监听失败时
    //...
}

（4）accept

cpp 复制代码

#include <sys/types.h>
#include <sys/socket.h>

int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);

accept函数常用于服务端从全连接队列中接收来自客户端的TCP连接请求并创建一个新的套接字，通常用于listen函数后。成功会返回该套接字的文件描述符用来负责后续的数据通信服务，失败返回-1并设置errno。

如果全连接队列中暂时没有Tcp连接请求，accept函数将阻塞等待直到有客户端发起连接请求（除非服务器处于非阻塞状态）

其中：

sockfd：被绑定并设置为监听状态的套接字对应的文件描述符
addr：指向sockaddr结构体的指针，用于填充客户端对应的地址信息。设置为NULL表示不关心客户端地址
addrlen：指向socklen_t的指针，表示addr的大小

例如：

cpp 复制代码

uint16_t port = 8888; //端口号
string ip = "127.0.0.1"; //字符串格式的ip地址
int sockfd = socket(AF_INET, SOCK_STREAM, 0); //创建套接字
if (sockfd < 0)
{
    // 创建套接字失败时
    //...
}
//填充结构体字段
struct sockaddr_in local;
memset(&local, 0, sizeof(local));
local.sin_family = AF_INET; //IPv4协议
local.sin_port = htons(port);
inet_aton(ip.c_str(), &(local.sin_addr)); 
if (bind(sockfd, (struct sockaddr *)&local, sizeof(local)) < 0) // 绑定
{
    // 绑定失败时
    //...
}
if (listen(sockfd, 10) < 0) // 将套接字设置为监听状态，全连接队列最多存放10+1个连接
{
    // 监听失败时
    //...
}
struct sockaddr_in client; // 存储客户端信息的结构体
socklen_t len = sizeof(client);
int newfd = accept(sockfd, (struct sockaddr *)&client, &len); // sockfd只负责获取连接，newfd负责后续的数据通信服务
if (newfd < 0)
{
    // 接收失败时
    //...
}

（5）connect

cpp 复制代码

#include <sys/types.h>
#include <sys/socket.h>

int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

connect函数常用于发起建立网络连接的请求，成功返回0，失败返回-1并设置errno

其中：

sockfd：调用socket函数创建套接字成功后返回的文件描述符
addr：指向sockaddr结构体的指针，其中包含了准备建立连接的目标服务器地址信息
addrlen：addr指向的结构体的大小

例如：

cpp 复制代码

string serverip = "127.0.0.1";
uint16_t serverport = 8888;
int sockfd = socket(AF_INET, SOCK_STREAM, 0); // 创建套接字
if (sockfd < 0)
{
    // 创建套接字失败时
    //...
}
// 填充结构体字段
struct sockaddr_in server;
memset(&server, 0, sizeof(server));
server.sin_family = AF_INET;
server.sin_port = htons(serverport);
inet_pton(AF_INET, serverip.c_str(), &(server.sin_addr));
// 发起连接
int n = connect(sockfd, (struct sockaddr *)&server, sizeof(server));
if (n < 0)
{
    // 连接发起失败时
    //...
}

（6）recvfrom

cpp 复制代码

#include <sys/types.h>
#include <sys/socket.h>

ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags,
                    struct sockaddr *src_addr, socklen_t *addrlen);

recvfrom常用于使用UDP协议（或其他无连接的数据报服务）时从套接字中读取数据，成功返回读取到的字节数，当套接字已经关闭时返回0，出错返回-1并设置errno

其中：

sockfd：已打开的套接字文件描述符
buf：指向用于存放接收到的数据的缓冲区的指针
len：缓冲区大小
flags：控制接收行为的标志，通常设置为0表示阻塞模式
src_addr：指向一个sockaddr结构体，存储数据来源方的地址信息
addrlen：代表sockaddr结构体的大小

例如：

cpp 复制代码

int sockfd = socket(AF_INET, SOCK_DGRAM, 0); // 创建套接字
if (sockfd < 0)
{
    //...
}
char buffer[1024];
sockaddr_in temp;
socklen_t len = sizeof(temp);
ssize_t s = recvfrom(sockfd, buffer, sizeof(buffer) - 1, 0,
             (struct sockaddr *)&temp, &len); // 接收服务端返回的消息
//...

（7）sendto

cpp 复制代码

#include <sys/types.h>
#include <sys/socket.h>

ssize_t sendto(int sockfd, const void *buf, size_t len, int flags,
               const struct sockaddr *dest_addr, socklen_t addrlen);

sendto函数常用于使用UDP协议时通过指定的socket将数据发送到目标主机，成功返回实际发送的字节数，失败返回-1并设置errno

其中：

sockfd：已打开的套接字文件描述符
buf：指向要发送的数据
len：要发送的数据长度
flags：标志位，通常设置为0
dest_addr：指向存储目标主机地址信息的sockaddr结构体
addrlen：结构体大小

4.3 地址转换函数

sockaddr_in结构体中的成员sin_addr表示32位的ip地址，但我们日常中见到的ip地址通常是点分十进制格式的字符串表示的。通过一些函数可以实现ip地址在两种格式间的转换。

字符串转32位ip地址：

（1）inet_aton

cpp 复制代码

#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>

int inet_aton(const char *cp, struct in_addr *inp);

其中：

cp：待转换的点分十进制ip地址字符串
inp：指向in_addr结构体的指针，存储转换后的网络字节序ip地址

in_addr内部存放了一个32位整型用于存储转换后的ip地址，其结构如下：

cpp 复制代码

typedef uint32_t in_addr_t;
struct in_addr
{
    in_addr_t s_addr;
};

例如：

cpp 复制代码

struct sockaddr_in addr;
inet_aton("127.0.0.1", &addr.sin_addr);

（2）inet_addr

cpp 复制代码

#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>

in_addr_t inet_addr(const char *cp);

其中cp是待转换的点分十进制ip地址字符串

例如：

cpp 复制代码

struct sockaddr_in addr;
addr.sin_addr.s_addr = inet_addr("127.0.0.1");

（3）inet_pton

cpp 复制代码

#include <arpa/inet.h>

int inet_pton(int af, const char *src, void *dst);

其中：

af：协议族
src：指向点分十进制ip地址字符串的指针
dst：指向用于存储转换后ip地址的内存区域

网络字节序ip地址转点分十进制的函数有inet_ntoa、inet_ntop，有兴趣的可以自行查阅文档

完.