一,socket简介
1.什么是socket
socket通常也称作"套接字",⽤于描述IP地址和端⼝,是⼀个通信链的句柄,应用程序通常通过"套接字"向⽹络发出请求或者应答⽹络请求。⽹络通信就是两个进程间的通信,这两个进程之间是如何识别彼此的呢?那就是套接字(Socket),每个套接字由⼀个 IP 地址和⼀个端⼝号组成。
Socket起源于Unix,⽽Unix/Linux基本哲学之⼀就是"⼀切皆⽂件",对于⽂件⽤【打开】【读写】【关闭】模式来操作
socket是⼀种特殊的⽂件,⼀些socket函数就是对其进⾏的操作(打开、读/写IO、关闭)。
套接字的类型:
1.流式套接字(SOCK_STREAM)
提供了⼀个面向连接、可靠的数据传输服务,数据⽆差错、⽆ 重复的发送且按发送顺序接收。内设置流量控制,避免数据流 淹没慢的接收⽅。数据被看作是字节流,无长度限制。
2. 数据报套接字(SOCK_DGRAM)
提供⽆连接服务。数据包以独⽴数据包的形式被发送,不提供⽆差错 保证,数据可能丢失或重复,顺序发送,可能乱序接收。
3.原始套接字(SOCK_RAW)
可以对较低层次协议,如IP、ICMP直接访问。功能强⼤但使⽤较为不便, 主要⽤于⼀些协议的开发。
socket在所有的⽹络操作系统中是必不可少,它是网络通信中应⽤程序对应的进程
和网络协议之间的接⼝。
2.网络字节序
计算机数据存储有两种字节优先顺序:高位字节优先 和低位字节优先。Internet上数据以⾼位字节优先顺序在网络上传输,所以对于在内部是以低位字节优先⽅式存储数据的机器,在Internet上传输数据时就需要进⾏转换,否则就会出现数据不⼀致。
内存中存储的多字节数据相对于内存地址有大端和小端 之分,网络数据流同样有大端小端之分。
主机字节序:就是自己的主机内部,内存中数据的存放⽅式,可以分为两种:
大端字节序(big-endian):按照内存的增长方向,高位数据存储于低位内存中
小端字节序(little-endian):按照内存的增长方向,高位数据存储于⾼位内存中。
⼤多数Intel兼容机都采⽤⼩端模式。
编写一个简单程序判断当前机器是大端机还是小端机
test.c
cpp
#include <stdio.h>
int main()
{
unsigned int num = 0x12345678;
unsigned char *p = (unsigned char *)#
if (*p == 0x78)
{
printf("当前是小端机\n");
}
else if (*p == 0x12)
{
printf("当前是大端机\n");
}
else
{
printf("无法判断\n");
}
return 0;
}
⽹络字节顺序: 是TCP/IP中规定好的⼀种数据表示格式,它与具体的CPU类型、操作系统等⽆关,⽹络数据流同样有⼤端⼩端之分,也就是说,当接收端收到第⼀个字节的时候,它将这个字节作为⾼位字节还是低位字节处理.从⽽可以保证数据在不同主机之间传输时能够被正确解释。网络字节顺序采⽤big endian排序⽅式(⾼位字节优先)。
⼀般考虑到计算机中的字符与⽹络中的字符存储顺序是不同的,当计算机中的整数与⽹络中的整数进⾏交换时,需要相关的函数进⾏转换。
传输字节时可分两种情况:
1.传输⼀个⾮单字节数据,这时要转换成⽹络字节顺序,
2.传输⼀个单字节数据,这时就不需要转换了,因为单字节数据⽆所谓G高或低字节优先
涉及相关函数如下:
#include <arpa/inet.h>
/*主机字节顺序 --> ⽹络字节顺序*/
uint32_t htonl(uint32_t hostlong); /* IP*/
uint16_t htons(uint16_t hostshort); /* 端⼝*/
in_addr_t inet_addr(const char *cp); //将⼀个点分字符串IP地址转换为⼀个32位的⽹络序列IP地址。所属头⽂件:Winsock2.h (windows) arpa/inet.h (Linux)
/*⽹络字节顺序 --> 主机字节顺序*/
uint32_t ntohl(uint32_t netlong); /* IP*/
char *inet_ntoa(struct in_addr in);//将⼀个32位的⽹络字节序转换为⼀个点分⼗进制字符串
struct in_addr //结构体in_addr ⽤来表示⼀个32位的IPv4地址。
{
in_addr_t s_addr; //in_addr_t ⼀般为 32位的unsigned int,其字节顺序为⽹络顺序
};
二,基于TCP/IP协议的socket通信
socket抽象层与体系结构关系示意图
当我们使⽤不同的协议进⾏通信时就得使⽤不同的接⼝,还得处理不同协议的各种细节,这就增加了开发的难度,软件也不易于扩展。于是就出现了socket,socket屏蔽了各个协议的通信细节,使得程序员无需关注协议本身,直接使⽤socket提供的接⼝来进⾏互联的不同主机间的进程的通信。
⼈们把socket设计成⽂件,通过描述符我们可以定位到具体的file结构体,file结构体中有个f_type属性,标识了⽂件的类型(⽐如套接⼦类型,so_pcb结构内包含了当前主机的地址和端⼝信息,这给结构的编号就是套接字的⽂件描述符,和进程的pcb块类似)
1. 基于TCP/ip的相关通信api简介
当进程创建⼀个socket套接字时,操作系统会相应的创建出⼀个由⽂件系统管理的socket对象,这个socket对象中包含:发送缓冲区、接收缓冲区、等待队列、 等成员。每⼀个tcp的套接字(socket)都有两个缓冲区,发送缓冲区和接收缓冲区都是先进先出的队列。
其中,等待队列是⾮常重要的成员。操作系统会将调动recv阻塞的进程挂在对应socket的等待队列
中(只是进程的引⽤,不是进程本身),此时进程进⼊阻塞态,不会占⽤CPU资源。
当socket上收到数据后,操作系统会将该socket从等待队列中重新放回到⼯作队列,继续执⾏。
1)创建套接字
cpp
#include <sys/types.h> /* See NOTES */
#include <sys/socket.h>
//建⽴⼀个新的socket(即为建⽴⼀个通信端⼝)
int socket(int domain, int type, int protocol);
成功返回⾮负的套接字描述符,失败返回 -1
参数说明:
domain:即协议域,⼜称为协议族(family)
Name Purpose Man page
AF_UNIX, AF_LOCAL Local communication unix(7)
AF_INET IPv4 Internet protocols ip(7)
AF_INET6 IPv6 Internet protocols ipv6(7)
AF_IPX IPX - Novell protocols
AF_NETLINK Kernel user interface device netlink(7)
AF_X25 ITU-T X.25 / ISO-8208 protocol x25(7)
AF_AX25 Amateur radio AX.25 protocol
AF_ATMPVC Access to raw ATM PVCs
AF_APPLETALK AppleTalk ddp(7)
AF_PACKET Low level packet interface packet(7)
AF_ALG Interface to kernel crypto API
type:
SOCK_STREAM TCP
SOCK_DGRAM UDP
SOCK_SEQPACKET 为最⼤⻓度固定的数据报提供有序、可靠、基于双向连接的数据
传输路径
SOCK_RAW 原始套接字
SOCK_RDM 提供不保证排序的可靠数据报层。
protocol:
⽤于指定socket所使⽤的传输协议编号,通常默认设置为0即可
0选择type类型对应的默认协议;
IPPROTO_TCP:TCP传输协议;
IPPROTO_UDP:UDP传输协议;
2)绑定套接字和服务器地址
注意:⼀般来说,⼀个端⼝释放后会等待两分钟之后才能再被使⽤,SO_REUSEADDR是让端⼝释放后⽴即就可以被再次使⽤。SO_REUSEADDR⽤于对TCP套接字处于TIME_WAIT状态下的socket,才可以重复绑定使⽤。server程序总是应该在调⽤bind()之前设置SO_REUSEADDR套接字选项。先调⽤close()的⼀⽅会进⼊TIME_WAIT状态。
cpp
#include <sys/types.h> /* See NOTES */
#include <sys/socket.h>
//⽤来给参数sockfd的socket设置⼀个名称,该名称由addr参数指向的sockadr结构
int bind(int sockfd, const struct sockaddr *addr, socklen_t addrle
n);
返回说明:成功返回 0 失败返回 -1
⽤途:主要⽤与在TCP中的连接
形参说明:
sockfd 套接字⽂件描述符
addr 服务器地址信息
struct sockaddr {
sa_family_t sa_family;
char sa_data[14];
}
但在编程中⼀般使⽤下边这种等价结构sockaddr,对于IPV4我们常⽤这个结构
注意:使⽤该结构需要包含:#include <netinet/in.h>头⽂件 ****
struct sockaddr_in {
sa_family_t sin_family; IPV4对应AF_INET
//htons()
u_int16_t sin_port; 端⼝号//sin_port存储端⼝
号(使⽤⽹络字节顺序)
struct in_addr sin_addr; IP地址 //inet_addr()将
字符串形象ip转⽹络字节序
};
/* Internet address. */
struct in_addr {
u_int32_t s_addr; IP地址
};
addrlen addr的⻓度 sizeof(struct sockaddr)
//如果使⽤IPV6地址,需要⽤这个结构来定义变量存放ipv6相关信息
struct sockaddr_in6 {
sa_family_t sin6_family; /* AF_INET6 */
in_port_t sin6_port; /* port number */
uint32_t sin6_flowinfo; /* IPv6 flow information */
struct in6_addr sin6_addr; /* IPv6 address */
uint32_t sin6_scope_id; /* Scope ID (new in 2.4) */
};
struct in6_addr {
unsigned char s6_addr[16]; /* IPv6 address */
};

3)监听模式
cpp
#include <sys/socket.h>
//⽤于等待参数sockfd的scoket连线
int listen(int sockfd, int backlog);
返回值说明:成功返回0,失败返回-1
sockfd 套接字⽂件描述符
backlog 监听队列⻓度(等待连接的客户端的个数)缺省值20,最⼤值为128
即为规定了内核应该为相应套接⼝排队的最⼤连接个数
4)等待客户端连接的到来
cpp
#include <sys/types.h>
#include <sys/socket.h>
//接收socket的连线
int accept(int sockfd, struct sockaddr *addr, socklen_t *addrle
n);
返回值说明:成功返回连接的客户端的套接字⽂件描述符 失败返回 -1
参数说明:
sockfd 服务器套接字⽂件描述符
addr 客户端信息地址,做返回值⽤的,不获取可以直接输⼊NULL
addrlen addr的⻓度,注意是⼀个指针类型 ,传⼊指定地址的⻓度,不指定
则NULL
5)客户端建立socket连线
cpp
#include <sys/types.h> /* See NOTES */
#include <sys/socket.h>
/*⽤于将参数sockfd的socket连接到参数addr指定的⽹络地址*/
int connect(int sockfd, const struct sockaddr *addr, socklen_t addrl
en);
addr:服务端的地址
addrlen:为scokarr的结构⻓度
返回值:返回0时,表明该连接已经成功建⽴,返回-1时,表明该连接发⽣了错误,即没有成
功建⽴连接。
注意:connect() 函数不阻塞,所以在使⽤之前要确保服务器已经进⼊等待连接状态。
6)读写函数
读(read/recvfrom/msgrcv):
读的本质来说其实不能是读,在实际中, 具体的接收数据不是由这些调⽤来进⾏,是由于系统底层⾃动完成的。read 也好,recv 也好只负责把数据从底层缓冲copy 到我们指定的位置。
写(send/write):
写的本质也不是进⾏发送操作,⽽是把⽤户态的数据copy 到系统底层去,然后再由系统进⾏发送操作,send,write返回成功,只表示数据已经copy 到底层缓冲,⽽不表示数据已经发出,更不能表示对⽅端⼝已经接收到数据。
cpp
#include<unistd.h>
//将数据写⼊已打开的⽂件内,写⼊count个字节到参数fd所指的⽂件内。
ssize_t write(int fd,const void*buf,size_t count);
//从已打开的⽂件中读取数据
ssize_t read(int fd,void*buf,size_t count);
返回值:读取到的实际数据数,如果返回0表示已经到达⽂件末尾或⽆可读取的数据,当read()函数
返回值为0时,
表示对端已经关闭了 socket,这时候也要关闭这个socket,否则会导致socket泄露。
当read()或者write()函数返回值⼤于0时,表示实际从缓冲区读取或者写⼊的字节数⽬
当read()或者write()返回-1时,⼀般要判断errno
⼀般是读写操作超时了,还未返回。这个超时是指socket的SO_RCVTIMEO与SO_SNDTIMEO两个属
性。
所以在使⽤阻塞socket时,不要将超时时间设置的过⼩。不然返回了-1,
你也不知道是socket连接是真的断开了,还是正常的⽹络抖动。⼀般情况下,阻塞的socket返回
了-1,
都需要关闭重新连接。
Close()和shutdown()------结束数据传输
当所有的数据操作结束以后,你可以调⽤close()函数来释放该socket,从⽽
停⽌在该socket上的任何数据操作:close(sockfd);
2.并发服务器
TCP服务器⼀次只能接收⼀个客户端的连接的请求,只有在该客户端的所有请求都满⾜后,服务器才可以继续响应后边的请求,如果⼀个客户端占⽤服务器不释放,其他客户端都不能⼯作了,因此上述的TCP服务器⼜称为循环服务器,鉴于TCP循环服务器的缺陷,很少TCP服务器采⽤。
为了解决循环TCP服务器的缺陷,⼈们⼜想出了并发服务器模型。并发服务器的思想为:每⼀个客户端的请求并不由服务器直接处理,⽽是由服务器创建⼀个子进程或⼦线程来解决。
示例程序:
server.c
cpp
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <pthread.h>
#include <arpa/inet.h>
#include <netinet/in.h>
#define PORT 8888
#define BUF_SIZE 1024
// 线程函数:处理一个客户端
void *handle_client(void *arg)
{
int client_sock = *(int *)arg;
free(arg);
char buffer[BUF_SIZE];
int n;
while ((n = read(client_sock, buffer, BUF_SIZE - 1)) > 0)
{
buffer[n] = '\0';
printf("[客户端消息] %s\n", buffer); // 在服务器端显示客户端消息
}
printf("客户端断开连接。\n");
close(client_sock);
return NULL;
}
int main()
{
int server_sock, *client_sock;
struct sockaddr_in server_addr, client_addr;
socklen_t client_len = sizeof(client_addr);
// 创建socket
server_sock = socket(AF_INET, SOCK_STREAM, 0);
if (server_sock < 0)
{
perror("socket");
exit(EXIT_FAILURE);
}
int opt = 1;
setsockopt(server_sock, SOL_SOCKET, SO_REUSEADDR, &opt, sizeof(opt));
server_addr.sin_family = AF_INET;
server_addr.sin_addr.s_addr = INADDR_ANY;
server_addr.sin_port = htons(PORT);
if (bind(server_sock, (struct sockaddr *)&server_addr, sizeof(server_addr)) < 0)
{
perror("bind");
close(server_sock);
exit(EXIT_FAILURE);
}
if (listen(server_sock, 5) < 0)
{
perror("listen");
close(server_sock);
exit(EXIT_FAILURE);
}
printf("服务器已启动,监听端口 %d...\n", PORT);
while (1)
{
client_sock = malloc(sizeof(int));
*client_sock = accept(server_sock, (struct sockaddr *)&client_addr, &client_len);
if (*client_sock < 0)
{
perror("accept");
free(client_sock);
continue;
}
printf("新客户端连接:%s:%d\n",
inet_ntoa(client_addr.sin_addr),
ntohs(client_addr.sin_port));
pthread_t tid;
pthread_create(&tid, NULL, handle_client, client_sock);
pthread_detach(tid);
}
close(server_sock);
return 0;
}
client.c
cpp
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#define PORT 8888
#define BUF_SIZE 1024
int main()
{
int sock;
struct sockaddr_in server_addr;
char buffer[BUF_SIZE];
// 创建socket
sock = socket(AF_INET, SOCK_STREAM, 0);
if (sock < 0)
{
perror("socket");
exit(EXIT_FAILURE);
}
server_addr.sin_family = AF_INET;
server_addr.sin_port = htons(PORT);
server_addr.sin_addr.s_addr = inet_addr("127.0.0.1"); // 服务器IP
if (connect(sock, (struct sockaddr *)&server_addr, sizeof(server_addr)) < 0)
{
perror("connect");
close(sock);
exit(EXIT_FAILURE);
}
printf("已连接到服务器,现在可以输入消息...\n");
while (1)
{
// 从标准输入读取消息
printf("输入: ");
if (fgets(buffer, BUF_SIZE, stdin) == NULL)
break;
// 发送到服务器
write(sock, buffer, strlen(buffer));
}
close(sock);
return 0;
}
运行结果:

三,基于UDP/IP协议的socket通信

基于UDP/IP通信的相关api简介
1)发送UDP报格式数据
cpp
#include <sys/types.h>
#include <sys/socket.h>
//把UDP数据报发给指定地址
int sendto (int sockfd, const void *buf, int len, unsigned int flags,
const struct sockaddr *to, int tolen);
参数说明:
sockfd 套接字⽂件描述符
buf 存放发送的数据
len 期望发送的数据⻓度
flags 0
to struct sockaddr_in类型,指明UDP数据发往哪⾥报
tolen: 对⽅地址⻓度,⼀般为:sizeof(struct sockaddr_in)。
2)接收UDP报格式数据
cpp
#include <sys/types.h>
#include <sys/socket.h>
//接收UDP的数据
int recvfrom(int sockfd, void *buf, int len, unsigned int flags,
struct sockaddr *from, int *fromlen);
参数意义和sentdo类似,其中romlen传递是接收到地址的⻓度
例如 int p=sizeof(struct adrr_in),最后⼀个参数就传为&p
注意:如果数据流量突然增⼤,也可以通过如下函数设置发送或接收缓冲区的大小。
调整UDP缓冲区⼤⼩:使用函数setsockopt()函数修改接收缓冲区大小
int setsockopt(int sockfd,int level,int optname,const void *optval,socklen_t optlen);
level:选项定义的层次:⽀持soL_SOCKET,IPPROTO_TCP,IPPROTO_IP和
IPPROTO_IPV6optname。
需设置得选项so_RCVBUF(接收缓冲区),So_SNDBUF(发送缓冲区)
3) 创建套接字 (Socket)
在进行任何网络通信之前,应用程序必须先向操作系统请求一个网络通信的"端点",这个端点就是套接字。
cpp
#include <sys/types.h>
#include <sys/socket.h>
// 创建一个套接字
int socket(int domain, int type, int protocol);```
**参数说明:**
* `domain`: 指定通信协议族。对于IPv4网络通信,这个值通常是 `AF_INET`。
* `type`: 指定套接字的类型。
* 对于UDP通信,这个值必须是 `SOCK_DGRAM` (Datagram),表示这是一个提供数据报服务的套接字,不建立连接,每个数据包都是独立的。
* (作为对比,TCP使用 `SOCK_STREAM`)
* `protocol`: 协议类型。通常设置为 `0`,让系统根据 `domain` 和 `type` 自动选择最合适的协议(对于 `AF_INET` 和 `SOCK_DGRAM`,系统会选择IPPROTO_UDP)。
**返回值:**
* **成功**:返回一个新的文件描述符 (一个非负整数),代表创建的套接字。后续的所有操作都将通过这个文件描述符进行。
* **失败**:返回 `-1`,并设置全局变量 `errno` 来表示错误原因。
**示例:**
```c
int sockfd;
sockfd = socket(AF_INET, SOCK_DGRAM, 0);
if (sockfd < 0) {
perror("socket creation failed");
exit(EXIT_FAILURE);
}
4) 绑定地址和端口 (Bind)
对于需要接收数据的UDP程序(通常是服务器端),必须将其创建的套接字与一个具体的IP地址和端口号关联起来。这样,当网络中有数据包发送到这个IP和端口时,操作系统才知道应该将数据交给哪个程序处理。
cpp
#include <sys/types.h>
#include <sys/socket.h>
// 将套接字与一个地址绑定
int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
参数说明:
-
sockfd: socket() 函数返回的套接字文件描述符。
-
addr: 一个指向 struct sockaddr 结构体的指针,但实际使用中通常传入一个 struct sockaddr_in 结构体(需要进行类型强制转换)。该结构体包含了要绑定的IP地址和端口号。
-
addrlen: addr 结构体的长度,通常为 sizeof(struct sockaddr_in)。
struct sockaddr_in 结构体详解:
cpp
struct sockaddr_in {
sa_family_t sin_family; // 地址族, 必须是 AF_INET
in_port_t sin_port; // 端口号 (需要使用 htons() 转换)
struct in_addr sin_addr; // IPv4 地址
};
struct in_addr {
uint32_t s_addr; // 32位的IPv4地址 (需要使用 inet_addr() 或 INADDR_ANY)
};
注意: 端口号和IP地址必须从"主机字节序"转换为"网络字节序"。通常使用 htons() (Host to Network Short) 来转换端口,使用 inet_addr("127.0.0.1") 或 INADDR_ANY (表示绑定到本机所有IP地址) 来设置地址。
返回值:
-
成功:返回 0。
-
失败:返回 -1,并设置 errno。
示例:
cpp
struct sockaddr_in servaddr;
servaddr.sin_family = AF_INET;
servaddr.sin_addr.s_addr = INADDR_ANY; // 监听任意网卡的请求
servaddr.sin_port = htons(8888); // 绑定到8888端口
if (bind(sockfd, (const struct sockaddr *)&servaddr, sizeof(servaddr)) < 0) {
perror("bind failed");
exit(EXIT_FAILURE);
}
对于UDP客户端,通常不需要显式调用 bind()。因为在第一次调用 sendto() 时,操作系统会自动为其分配一个临时的端口号。
5) 关闭套接字 (Close)
当通信结束时,应该释放套接字占用的系统资源。这个操作就像关闭一个文件一样。
cpp
#include <unistd.h>
// 关闭一个文件描述符
int close(int fd);
参数说明:
- fd: 需要关闭的文件描述符,这里就是 socket() 返回的套接字文件描述符。
返回值:
-
成功:返回 0。
-
失败:返回 -1,并设置 errno。
示例:
cpp
printf("通信结束,关闭套接字。\n");
close(sockfd);
总结:一个典型UDP程序的API调用流程
-
服务器端:
-
socket(): 创建套接字。
-
bind(): 为套接字绑定一个固定的IP和端口,以便客户端能找到它。
-
recvfrom(): 循环等待并接收来自客户端的数据。
-
sendto(): (可选)向客户端发送响应。
-
close(): 程序结束时关闭套接字。
-
-
客户端:
-
socket(): 创建套接字。
-
sendto(): 向服务器的指定IP和端口发送数据。
-
recvfrom(): (可选)接收来自服务器的响应。
-
close(): 程序结束时关闭套接字。
-