理解网络编程和套接字
网络编程
网络编程就是编写程序使两台联网的计算机相互交换数据。
计算机之间传输数据首先需要物理连接,绝大部分计算机都已连接到庞大的互联网,所以这一点不必担忧;在此基础上,只需要考虑如何编写数据传输软件,操作系统为此提供名为"套接字"的部件。
套接字
套接字是网络数据传输用的软件设备,是网络编程中的一种基本通信机制,用于在网络中建立、管理和终止计算机之间的连接 ,它提供了一种在计算机网络中进行数据传输的接口,通过网络协议(如TCP/IP)与其他套接字进行通信。
构建套接字
服务器端套接字的构建步骤
① 调用 socket
函数创建套接字。
c
#include <sys/socket.h>
// 成功时返回文件描述符,失败时返回-1
int socket(int domain, int type, int protocol);
② 调用 bind
函数分配 IP 地址和端口号。
c
#include <sys/socket.h>
// 成功时返回0,失败时返回-1
int bind(int sockfd, struct sockaddr* myaddr, socklen_t addrlen);
③ 调用 listen
函数转为可接收请求状态。
c
#include <sys/socket.h>
// 成功时返回0,失败时返回-1
int listen(int sockfd, int backlog);
④ 调用 accept
函数受理连接请求。
c
#include <sys/socket.h>
// 成功时返回文件描述符,失败时返回-1
int accept(int sockfd, struct sockaddr* addr, socklen_t* addrlen);
客户端套接字的构建步骤
① 调用 socket
函数创建套接字。
同服务器端。
② 调用 connect
函数向服务器端发送连接请求。
c
#include <sys/socket.h>
// 成功时返回0,失败时返回-1
int connect(int sockfd, struct sockaddr* serv_addr, socklen_t addrlen);
简单服务器实现
下述代码是一个简单的TCP服务器的实现,它创建了一个服务器,监听指定端口,并在接收到客户端的连接请求后,向客户端发送一条消息。当前不必理解全部代码,只需关注套接字相关函数的调用过程。
服务器端(hello_server.c)
c
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>
void error_handling(const char *message)
{
fputs(message, stderr);
fputc('\n', stderr);
exit(1);
}
int main(int argc, char *argv[])
{
int serv_sock;
int clnt_sock;
struct sockaddr_in serv_addr;
struct sockaddr_in clnt_addr;
socklen_t clnt_addr_size;
char message[] = "Hello World!";
if(argc != 2)
{
printf("Usage: %s <port>\n", argv[0]);
exit(1);
}
// 调用 socket 函数创建套接字
serv_sock = socket(PF_INET, SOCK_STREAM, 0);
if(serv_sock == -1)
error_handling("socket() error");
memset(&serv_addr, 0, sizeof(serv_addr));
serv_addr.sin_family = AF_INET;
serv_addr.sin_addr.s_addr = htonl(INADDR_ANY);
serv_addr.sin_port = htons(atoi(argv[1]));
// 调用 bind 函数分配 IP 地址和端口号
if(bind(serv_sock, (struct sockaddr*) &serv_addr, sizeof(serv_addr)) == -1)
error_handling("bind() error");
// 调用 listen 函数将套接字转为可接收连接状态
if(listen(serv_sock, 5) == -1)
error_handling("listen() error");
clnt_addr_size = sizeof(clnt_addr);
// 调用 accept 函数受理连接请求。如果在没有连接请求的情况下调用该函数,则不会返回,直到有连接请求为止
clnt_sock = accept(serv_sock, (struct sockaddr*) &clnt_addr, &clnt_addr_size);
if(clnt_sock == -1)
error_handling("accept() error");
// write 函数用于传输数据
write(clnt_sock, message, sizeof(message));
close(clnt_sock);
close(serv_sock);
return 0;
}
客户端(hello_client.c)
c
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>
void error_handling(const char* message)
{
fputs(message, stderr);
fputc('\n', stderr);
exit(1);
}
int main(int argc, char* argv[])
{
int sock;
struct sockaddr_in serv_addr;
char message[30];
int str_len;
if(argc != 3)
{
printf("Usage: %s <IP> <port>\n", argv[0]);
exit(1);
}
// 创建套接字,但此时套接字并不马上分为服务器端和客户端。
// 如果紧接着调用 bind、lsiten 函数,将成为服务器端套接字;
// 如果调用 connect 函数,将成为客户端套接字。
sock = socket(PF_INET, SOCK_STREAM, 0);
if(sock == -1)
error_handling("socket() error");
memset(&serv_addr, 0, sizeof(serv_addr));
serv_addr.sin_family = AF_INET;
serv_addr.sin_addr.s_addr = inet_addr(argv[1]);
serv_addr.sin_port = htons(atoi(argv[2]));
// 调用 connect 函数向服务器端发送连接请求
if(connect(sock, (struct sockaddr*) &serv_addr, sizeof(serv_addr)) == -1)
error_handling("connect() error!");
str_len = read(sock, message, sizeof(message) - 1);
if(str_len == -1)
error_handling("read() error!");
printf("Message from server : %s \n", message);
close(sock);
return 0;
}
运行结果
- hello_server.c
正常情况下程序将停留在此状态,因为服务器端调用的 accept
函数还未返回。接下来运行客户端。
- hello_client.c
知识点
(1)套接字在网络编程中的作用是什么?为何称它为套接字?
套接字的作用
-
网络通信的端点:
- 套接字是网络通信的基本端点,允许程序通过网络与其他计算机或设备进行数据交换。它提供了一个通信接口,使得应用程序能够通过网络发送和接收信息。
-
抽象和简化:
- 套接字为网络编程提供了一个统一的接口,屏蔽了底层的网络协议和复杂的实现细节。程序员可以通过标准的套接字API(如
socket()
,bind()
,listen()
,accept()
,send()
,recv()
,close()
)进行操作,而无需深入了解底层的协议实现。
- 套接字为网络编程提供了一个统一的接口,屏蔽了底层的网络协议和复杂的实现细节。程序员可以通过标准的套接字API(如
-
支持不同协议:
-
套接字可以使用不同的协议进行通信,最常见的是TCP(面向连接)和UDP(无连接)。不同的套接字类型支持不同的通信模式:
- 流式套接字(Stream Socket) :通常基于TCP,提供可靠的、面向连接的通信。
- 数据报套接字(Datagram Socket) :通常基于UDP,提供无连接的、尽力而为的通信。
-
-
建立和管理连接:
- 套接字用于建立、维护和终止网络连接。服务器端使用套接字监听连接请求,客户端使用套接字发起连接。连接建立后,数据可以通过套接字进行传输。
-
数据传输:
- 套接字提供了数据的发送和接收功能。应用程序可以使用套接字发送数据到远程主机,并接收来自远程主机的数据。
为什么称其为"套接字"?
套接字(Socket)这个词可以理解为一个连接点或插口,它在网络编程中充当了两个通信实体之间的接头部分。正如电气工程中的插头和插座一样,网络套接字提供了连接网络上不同计算机的接口。
(2)服务器端创建套接字后,会依次调用 listen 函数和 accept 函数,请比较并说明二者区别
特点 | listen |
accept |
---|---|---|
作用 | 将套接字设置为监听状态,等待连接请求。 | 从监听队列中取出一个连接请求,并返回一个新的套接字。 |
调用时机 | 在bind 之后、accept 之前调用。 |
在listen 之后调用。 |
返回值 | 无返回值,函数成功时返回0,失败时返回-1。 | 返回新的套接字描述符用于与客户端通信,失败时返回-1。 |
处理方式 | 标记套接字为可接受连接的状态。 | 提取一个连接请求并为其创建新的套接字。 |
状态 | 进入监听状态,等待客户端连接。 | 为每个客户端连接创建一个新的套接字。 |
(3)Linux中,对套接字数据进行I/O时可以直接使用文件I/O相关函数,Windows中则不可以,原因为何?
Linux中的套接字I/O与文件I/O
在Linux中,套接字和文件都被视为文件描述符(file descriptors)。这种设计理念被称为"Everything is a file"(一切皆文件)。具体来说:
-
统一的I/O接口:
- 在Linux中,套接字、文件、管道、设备等都使用相同的文件描述符接口。即,套接字和普通文件使用相同的系统调用接口(如
read()
、write()
、close()
等)进行I/O操作。 - 例如,套接字的读写操作可以直接使用
read()
和write()
函数,这与操作文件的方式是相同的。
- 在Linux中,套接字、文件、管道、设备等都使用相同的文件描述符接口。即,套接字和普通文件使用相同的系统调用接口(如
-
原因:
- 设计简化:这种设计简化了I/O操作的实现和使用,因为操作系统的I/O模型对所有资源类型都是一致的。
- 抽象层:操作系统通过文件描述符抽象了底层硬件和资源,使得不同类型的I/O操作可以通过相同的接口进行处理。
Windows中的套接字I/O与文件I/O
在Windows中,套接字的I/O操作与文件的I/O操作是分开的。Windows使用了不同的API来处理套接字和文件:
-
不同的API:
- 在Windows中,套接字操作是通过Winsock API(Windows Sockets API)完成的。常用的函数包括
recv()
、send()
、closesocket()
等。 - 文件I/O操作则使用Windows文件I/O API,如
ReadFile()
、WriteFile()
、CloseHandle()
等。
- 在Windows中,套接字操作是通过Winsock API(Windows Sockets API)完成的。常用的函数包括
-
原因:
- 设计选择:Windows的设计没有采用Linux中"一切皆文件"的理念,而是对套接字和文件采用了不同的API。这种设计选择源于历史和架构的不同。
- 灵活性:分开处理套接字和文件的API允许更精细的控制和优化。例如,套接字API专门处理网络通信的特性(如缓冲区、协议),而文件I/O API则专注于文件系统的操作。
- 兼容性:早期Windows版本的API设计就决定了这种差异,而这种差异也与Windows的整体架构和设计理念有关。尽管这种差异可能导致学习和迁移的复杂性,但它也允许Windows系统在网络编程和文件系统编程上提供不同的特性和优化。
(4)创建套接字后一般会给它分配地址,为什么?为了完成地址分配需要调用哪个函数?
为什么需要分配地址
-
标识网络节点:
- 每个网络节点(如服务器或客户端)在网络上需要一个唯一的地址,以便其他节点能够找到它并进行通信。这个地址通常包括IP地址和端口号。
-
接收数据:
- 套接字在网络上接收数据时,必须绑定到一个特定的地址。这样,操作系统才能将到达的数据包正确地路由到相应的套接字。
-
网络通信:
- 对于服务器端,分配地址使服务器能够监听来自客户端的连接请求。对于客户端,分配地址(通常是动态分配的)使客户端能够通过特定的端口与服务器通信。
地址分配所需的函数
bind
函数:
bind
函数用于将一个套接字与一个本地地址(IP地址和端口号)绑定在一起。这是完成地址分配的关键步骤。
c
int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
-
sockfd
:套接字描述符,通过socket
函数创建。 -
addr
:指向sockaddr
结构体的指针,指定要绑定的地址信息。 -
addrlen
:addr
结构体的大小。
(5)Linux中的文件描述符与Windows的句柄实际上非常类似,请以套接字为对象说明它们的含义。
文件描述符与句柄的比较
特性 | 文件描述符(Linux) | 句柄(Windows) |
---|---|---|
类型 | 非负整数 | 指针类型(实际上是一个整数,但作为抽象引用) |
创建 | socket() 函数返回文件描述符 |
socket() 函数返回句柄 |
关闭 | 使用 close() 函数 |
使用 closesocket() 函数 |
访问 | 通过整数索引访问文件或网络套接字 | 通过句柄引用访问系统对象 |
抽象 | 抽象为一个简单的整数索引 | 抽象为一个指向系统对象的引用 |
-
文件描述符 和句柄都用于标识和访问系统中的I/O资源,包括套接字。在Linux中,文件描述符是一个简单的非负整数,用于索引打开的文件或套接字。而在Windows中,句柄是一种抽象的引用,用于标识系统对象,包括文件和套接字。
-
虽然在实现上有所不同,两个概念都为操作系统提供了一种统一的方式来管理和访问各种资源。在应用程序编程中,文件描述符和句柄都扮演着关键角色,使得程序能够有效地进行网络通信和文件操作。